Definizione sensata di polinomio
Ciao a tutti,
so che nel Forum si è parlato più volte della definizione di polinomio come successione definitivamente nulla, tuttavia non la riesco a digerire, specialmente quando gli si assegna la scrittura formale
\[ \sum_{i=0}^n a_i x^i \]
nell'indeterminata \( x \).
Ma cos'è un'indeterminata? Nessuno lo spiega. C'è chi dice che è un "simbolo", ma cosa vuol dire elevare un simbolo alla \( i \)? Non riesco a dargli un senso.
Veniamo ora alla domanda: non si può semplicemente dire che se io fisso un campo \( \mathbb{K} \) un polinomio a coefficienti in \( \mathbb{K} \) è l'elemento di \( \mathbb{K} \)
\[ \sum_{i=0}^n a_i x^i \]
dove \( x \in \mathbb{K} \) è fissato una volta per tutte? È una definizione rigorosa e non fa utilizzo della parola ambigua "indeterminata".
In tal caso, l'insieme \( \mathbb{K}[x] \) dei polinomi a coefficienti in \( \mathbb{K} \) nell'incognita \( x \) (dove in questo caso non è ambiguo parlare di incognita, dato che ho detto esplicitamente da dove viene pescata quella \( x \)) risulterebbe essere un sottoinsieme di \( \mathbb{K} \), dico bene?
Chi mi aiuta a chiarire?
so che nel Forum si è parlato più volte della definizione di polinomio come successione definitivamente nulla, tuttavia non la riesco a digerire, specialmente quando gli si assegna la scrittura formale
\[ \sum_{i=0}^n a_i x^i \]
nell'indeterminata \( x \).
Ma cos'è un'indeterminata? Nessuno lo spiega. C'è chi dice che è un "simbolo", ma cosa vuol dire elevare un simbolo alla \( i \)? Non riesco a dargli un senso.
Veniamo ora alla domanda: non si può semplicemente dire che se io fisso un campo \( \mathbb{K} \) un polinomio a coefficienti in \( \mathbb{K} \) è l'elemento di \( \mathbb{K} \)
\[ \sum_{i=0}^n a_i x^i \]
dove \( x \in \mathbb{K} \) è fissato una volta per tutte? È una definizione rigorosa e non fa utilizzo della parola ambigua "indeterminata".
In tal caso, l'insieme \( \mathbb{K}[x] \) dei polinomi a coefficienti in \( \mathbb{K} \) nell'incognita \( x \) (dove in questo caso non è ambiguo parlare di incognita, dato che ho detto esplicitamente da dove viene pescata quella \( x \)) risulterebbe essere un sottoinsieme di \( \mathbb{K} \), dico bene?
Chi mi aiuta a chiarire?
Risposte
Non è niente l'indeterminata, è solo un ausilio per scrivere le cose, chiedere cos'è un'indeterminata è un po' come chiedere cos'è la lettera A 
Un polinomio a coefficienti in [tex]K[/tex] è un elemento di [tex]K^{(\mathbb{N})}[/tex], cioè una funzione [tex]f: \mathbb{N} \to K[/tex] a supporto finito (cioè tale che [tex]\{n \in \mathbb{N}\ :\ f(n) \neq 0\}[/tex] è finito). Poi uno si accorge che per le cose che vuole fare è conveniente scrivere questa funzione [tex]f[/tex] come [tex]\sum_i f(i)X^i[/tex]. Questo è solo un modo di scrivere la [tex]f[/tex], nient'altro. Si potrebbe scrivere semplicemente [tex]f[/tex] oppure [tex](f(0),f(1),f(2),f(3),\ldots)[/tex] ma si farebbe più fatica a definire le cose, nella fattispecie il prodotto tra due polinomi, facendole risultare naturali e ragionevoli. La scrittura [tex]\sum_i f(i)X^i[/tex] è solo una scrittura, un modo di scrivere la [tex]f[/tex], non c'è necessità di definire il simbolo ausiliario [tex]X[/tex].
Se fissi [tex]x \in K[/tex] non ottieni un polinomio, ottieni una funzione [tex]K \to K[/tex], quella che manda [tex]x[/tex] in [tex]P(x) = \sum_i a_i x^i[/tex]. Un polinomio è una cosa, una funzione polinomiale è un'altra cosa. Vedi qui.

Un polinomio a coefficienti in [tex]K[/tex] è un elemento di [tex]K^{(\mathbb{N})}[/tex], cioè una funzione [tex]f: \mathbb{N} \to K[/tex] a supporto finito (cioè tale che [tex]\{n \in \mathbb{N}\ :\ f(n) \neq 0\}[/tex] è finito). Poi uno si accorge che per le cose che vuole fare è conveniente scrivere questa funzione [tex]f[/tex] come [tex]\sum_i f(i)X^i[/tex]. Questo è solo un modo di scrivere la [tex]f[/tex], nient'altro. Si potrebbe scrivere semplicemente [tex]f[/tex] oppure [tex](f(0),f(1),f(2),f(3),\ldots)[/tex] ma si farebbe più fatica a definire le cose, nella fattispecie il prodotto tra due polinomi, facendole risultare naturali e ragionevoli. La scrittura [tex]\sum_i f(i)X^i[/tex] è solo una scrittura, un modo di scrivere la [tex]f[/tex], non c'è necessità di definire il simbolo ausiliario [tex]X[/tex].
Se fissi [tex]x \in K[/tex] non ottieni un polinomio, ottieni una funzione [tex]K \to K[/tex], quella che manda [tex]x[/tex] in [tex]P(x) = \sum_i a_i x^i[/tex]. Un polinomio è una cosa, una funzione polinomiale è un'altra cosa. Vedi qui.
"Riccardo Desimini":
Ma cos'è un'indeterminata? Nessuno lo spiega. C'è chi dice che è un "simbolo", ma cosa vuol dire elevare un simbolo alla \( i \)?
Io studio queste cose da autodidatta per passione personale, quindi prendi con le molle quanto ti dico, ma trovo utile pensare ad un'indeterminata \(X^i\) come ad una sorta di "segnaposto" che colloca il proprio coefficiente nell'$(i+1)$-esima posizione nella successione. Analogamente per polinomi in più variabili \(X_0^{\mu_0}X_1^{\mu_1}...X_n^{\mu_n}\) l'interpreterei (sulla base di quanto leggo qui alle pp. 48 e 50) come segnaposto in una $(n+1)$-dimensionale posizione di indice \((\mu_0,\mu_1,...,\mu_n)\).
Spero di non sbagliare e di venire corretto se sbaglio.
Ma scusate ragazzi, quando io scrivo un'equazione lineare del tipo
\[ a_1 X_1 + \dots + a_n X_n = b \]
le indeterminate \( X_i \) sono appunto elementi del campo di appartenenza dei coefficienti e del termine noto, non dei segnaposto, sennò che senso avrebbe parlare di soluzione di un'equazione?
Sul Sernesi quando parla di sistemi lineari parla, appunto, di indeterminate, però a me risulta che il primo membro dell'equazione che ho scritto sopra non è solo una scrittura formale, bensì una vera e propria somma algebrica.
Com'è che si conciliano le due cose? Questo non mi è chiaro.
\[ a_1 X_1 + \dots + a_n X_n = b \]
le indeterminate \( X_i \) sono appunto elementi del campo di appartenenza dei coefficienti e del termine noto, non dei segnaposto, sennò che senso avrebbe parlare di soluzione di un'equazione?
Sul Sernesi quando parla di sistemi lineari parla, appunto, di indeterminate, però a me risulta che il primo membro dell'equazione che ho scritto sopra non è solo una scrittura formale, bensì una vera e propria somma algebrica.
Com'è che si conciliano le due cose? Questo non mi è chiaro.
Le cose si conciliano nel senso seguente: risolvere un'equazione polinomiale è chiedersi dove vale zero un polinomio valutato. In altre parole quando risolvi un'equazione polinomiale del tuo polinomio ti interessa solo la corrispondente funzione polinomiale. E come ho detto sopra i polinomi sono una cosa, le funzioni polinomiali tutta un'altra cosa.
Per fare un esempio concreto: in [tex]\mathbb{Z}/2\mathbb{Z}[/tex] l'equazione polinomiale [tex]X^2+X = 0[/tex] ha tutti gli elementi di [tex]\mathbb{Z}/2\mathbb{Z}[/tex] come soluzioni, cioè [tex]x^2+x = 0[/tex] per ogni [tex]x \in \mathbb{Z}/2\mathbb{Z}[/tex], cioè la funzione polinomiale [tex]x \mapsto x^2+x[/tex] è nulla, ma questo non inficia il diritto di [tex]X^2+X[/tex] di essere un rispettabile polinomio non nullo di grado 2. Se tu considerassi [tex]X \in \mathbb{Z}/2\mathbb{Z}[/tex] allora avresti che [tex]X^2+X[/tex] è uguale a [tex]0[/tex] come polinomio, e questo di certo non lo vogliamo.
Per fare un esempio concreto: in [tex]\mathbb{Z}/2\mathbb{Z}[/tex] l'equazione polinomiale [tex]X^2+X = 0[/tex] ha tutti gli elementi di [tex]\mathbb{Z}/2\mathbb{Z}[/tex] come soluzioni, cioè [tex]x^2+x = 0[/tex] per ogni [tex]x \in \mathbb{Z}/2\mathbb{Z}[/tex], cioè la funzione polinomiale [tex]x \mapsto x^2+x[/tex] è nulla, ma questo non inficia il diritto di [tex]X^2+X[/tex] di essere un rispettabile polinomio non nullo di grado 2. Se tu considerassi [tex]X \in \mathbb{Z}/2\mathbb{Z}[/tex] allora avresti che [tex]X^2+X[/tex] è uguale a [tex]0[/tex] come polinomio, e questo di certo non lo vogliamo.
Mmmh forse inizio a capire, ma devo comunque digerire questa cosa.
Per il momento, grazie.
Per il momento, grazie.
I polinomi possono anche essere definiti in modo univoco dalla loro proprietà universale (http://arbourj.wordpress.com/2012/04/26 ... ial-rings/) ma non tutti amano questo approccio categoriale.
Ho trovato questo bellissimo documento che definisce i polinomi come delle successioni, ma senza utilizzare il concetto di indeterminata; l'ho trovato eccellente.
Magari qualcuno di voi è interessato.
Magari qualcuno di voi è interessato.
Mi sembra che l'approccio sia identico a quello classico. L'uso dell'indeterminata, come già detto, è solo una cosa formale che ha il vantaggio di rispecchiare il prodotto di convoluzione.
Insomma. L'importante, almeno all'inizio, è dimenticarsi che l'indeterminata può essere sostituita da un elemento dell'anello (attraverso il morfismo di valutazione). Il polinomio è solo un modo "inusuale" di scrivere una successione.
Insomma. L'importante, almeno all'inizio, è dimenticarsi che l'indeterminata può essere sostituita da un elemento dell'anello (attraverso il morfismo di valutazione). Il polinomio è solo un modo "inusuale" di scrivere una successione.
@ Riccardo: Sarò molto rozzo.
Un polinomio a coefficienti in un anello commutativo unitario \(\mathbb{A}\), per definizione, è una successione appartenente a \(c_{00}(\mathbb{A})\), in cui \(c_{00}(\mathbb{A})\) è il sottospazio di \(\mathbb{A}^{\mathbb{N}}\) che contiene tutte e sole le successioni definitivamente nulle, i.e. le successioni \(\mathbf{a}=(a_n)\) tali che:
\[
\exists \nu \in \mathbb{N}:\ \forall n\geq \nu,\ a_n=0_{\mathbb{A}}\; .
\]
Con tecniche standard, si vede che \(c_{00}(\mathbb{A})\) è il sottospazio vettoriale di \(\mathbb{A}^{\mathbb{N}}\) generato dalla famiglia \(\{\mathbf{e}^k, k\in \mathbb{N}\}\), in cui \(\mathbf{e}^k:=(\delta_n^k)\) e \(\delta_n^k\) è il consueto simbolo di Kroneker, i.e.:
\[
\delta_n^k := \begin{cases} 0_{\mathbb{A}} &\text{, se } n\neq k\\
1_{\mathbb{A}} &\text{, se } n= k\; ;
\end{cases}
\]
invero, fissata \(\mathbf{a}=(a_n)\in c_{00}(\mathbb{A})\) e posto:
\[
v=\min \{\nu \in \mathbb{N}:\ \forall n\geq \nu,\ a_n =0_\mathbb{A}\}\; ,
\]
si ha:
\[
\mathbf{a} = \sum_{k=0}^v a_k\ \mathbf{e}^k\; .
\]
In più si vede che gli \(\{\mathbf{e}^k, k\in \mathbb{N}\}\) è una base per \(c_{00}(\mathbb{A})\) (perché esso è un sistema di generatori linearmente indipendenti).
Se \(\mathbf{a}\) non è il polinomio nullo \(\mathbf{0}:=(0,0,\ldots,0,\ldots)\), il numero \(v=v(\mathbf{a})\) definito sopra si chiama grado di \(\mathbf{a}\). Se, invece, \(\mathbf{a}=\mathbf{0}\), si pone per definizione \(v(\mathbf{0}):=-\infty\) (questa definizione serve a far tornare alcuni conti).
Allora se conveniamo, inter nos, di denotare col simbolo \(X^k\) il vettore \(\mathbf{e}^k\), ogni polinomio \(\mathbf{a}\) si scrive in unico modo come combinazione lineare dei simboli \(X^k\), i.e.:
\[
\mathbf{a} = \sum_{k=0}^v a_k\ X^k\; .
\]
A questo punto abbiamo uno spazio vettoriale di polinomi, con le operazioni di somma e prodotto per lo scalare che si svolgono nel modo consueto.
L'unica cosa da sistemare è la definizione del prodotto... Per definizione, scelte \(\mathbf{a}=(a_n), \mathbf{b}=(b_n)\in c_{00}(\mathbb{A})\) definiamo la successione \(\mathbf{c}=(c_n)\) ponendo:
\[
c_n := \sum_{h=0}^n a_h\ b_{n-h}
\]
per ogni indice \(n\). Si vede la \(\mathbf{c}\) così definita è in \(c_{00}(\mathbb{A})\) e che, in generale, vale la disuguaglianza:
\[
v(\mathbf{c})\leq v(\mathbf{a}) + v(\mathbf{b})\; .
\]
Allora la costruzione precedente consente di definire un'operazione \(*:c_{00}(\mathbb{A})\times c_{00}(\mathbb{A})\to c_{00}(\mathbb{A})\) ponendo:
\[
\mathbf{a}*\mathbf{b}:=\mathbf{c} = \left( \sum_{h=0}^n a_h\ b_{n-h} \right)\; ,
\]
e si vede che \(*\) gode di tutte le usuali proprietà di un prodotto (commutativo, distributivo, elemento neutro).
In particolare, se \(\mathbf{A}\) è un dominio d'integrità, allora vale la regola di addizione dei gradi, i.e. l'uguaglianza \(v(\mathbf{a}*\mathbf{b}) = v(\mathbf{a}) + v(\mathbf{b})\), ed introducendo i soliti simboli \(X^k\) si vede che:
\[
\mathbf{a}*\mathbf{b} = \sum_{k=0}^{v(\mathbf{a}*\mathbf{b})} \left( \sum_{h=0}^n a_h\ b_{n-h} \right)\ X^k
\]
sicché ritrovi la solita regola del calcolo letterale.
Un polinomio a coefficienti in un anello commutativo unitario \(\mathbb{A}\), per definizione, è una successione appartenente a \(c_{00}(\mathbb{A})\), in cui \(c_{00}(\mathbb{A})\) è il sottospazio di \(\mathbb{A}^{\mathbb{N}}\) che contiene tutte e sole le successioni definitivamente nulle, i.e. le successioni \(\mathbf{a}=(a_n)\) tali che:
\[
\exists \nu \in \mathbb{N}:\ \forall n\geq \nu,\ a_n=0_{\mathbb{A}}\; .
\]
Con tecniche standard, si vede che \(c_{00}(\mathbb{A})\) è il sottospazio vettoriale di \(\mathbb{A}^{\mathbb{N}}\) generato dalla famiglia \(\{\mathbf{e}^k, k\in \mathbb{N}\}\), in cui \(\mathbf{e}^k:=(\delta_n^k)\) e \(\delta_n^k\) è il consueto simbolo di Kroneker, i.e.:
\[
\delta_n^k := \begin{cases} 0_{\mathbb{A}} &\text{, se } n\neq k\\
1_{\mathbb{A}} &\text{, se } n= k\; ;
\end{cases}
\]
invero, fissata \(\mathbf{a}=(a_n)\in c_{00}(\mathbb{A})\) e posto:
\[
v=\min \{\nu \in \mathbb{N}:\ \forall n\geq \nu,\ a_n =0_\mathbb{A}\}\; ,
\]
si ha:
\[
\mathbf{a} = \sum_{k=0}^v a_k\ \mathbf{e}^k\; .
\]
In più si vede che gli \(\{\mathbf{e}^k, k\in \mathbb{N}\}\) è una base per \(c_{00}(\mathbb{A})\) (perché esso è un sistema di generatori linearmente indipendenti).
Se \(\mathbf{a}\) non è il polinomio nullo \(\mathbf{0}:=(0,0,\ldots,0,\ldots)\), il numero \(v=v(\mathbf{a})\) definito sopra si chiama grado di \(\mathbf{a}\). Se, invece, \(\mathbf{a}=\mathbf{0}\), si pone per definizione \(v(\mathbf{0}):=-\infty\) (questa definizione serve a far tornare alcuni conti).
Allora se conveniamo, inter nos, di denotare col simbolo \(X^k\) il vettore \(\mathbf{e}^k\), ogni polinomio \(\mathbf{a}\) si scrive in unico modo come combinazione lineare dei simboli \(X^k\), i.e.:
\[
\mathbf{a} = \sum_{k=0}^v a_k\ X^k\; .
\]
A questo punto abbiamo uno spazio vettoriale di polinomi, con le operazioni di somma e prodotto per lo scalare che si svolgono nel modo consueto.
L'unica cosa da sistemare è la definizione del prodotto... Per definizione, scelte \(\mathbf{a}=(a_n), \mathbf{b}=(b_n)\in c_{00}(\mathbb{A})\) definiamo la successione \(\mathbf{c}=(c_n)\) ponendo:
\[
c_n := \sum_{h=0}^n a_h\ b_{n-h}
\]
per ogni indice \(n\). Si vede la \(\mathbf{c}\) così definita è in \(c_{00}(\mathbb{A})\) e che, in generale, vale la disuguaglianza:
\[
v(\mathbf{c})\leq v(\mathbf{a}) + v(\mathbf{b})\; .
\]
Allora la costruzione precedente consente di definire un'operazione \(*:c_{00}(\mathbb{A})\times c_{00}(\mathbb{A})\to c_{00}(\mathbb{A})\) ponendo:
\[
\mathbf{a}*\mathbf{b}:=\mathbf{c} = \left( \sum_{h=0}^n a_h\ b_{n-h} \right)\; ,
\]
e si vede che \(*\) gode di tutte le usuali proprietà di un prodotto (commutativo, distributivo, elemento neutro).
In particolare, se \(\mathbf{A}\) è un dominio d'integrità, allora vale la regola di addizione dei gradi, i.e. l'uguaglianza \(v(\mathbf{a}*\mathbf{b}) = v(\mathbf{a}) + v(\mathbf{b})\), ed introducendo i soliti simboli \(X^k\) si vede che:
\[
\mathbf{a}*\mathbf{b} = \sum_{k=0}^{v(\mathbf{a}*\mathbf{b})} \left( \sum_{h=0}^n a_h\ b_{n-h} \right)\ X^k
\]
sicché ritrovi la solita regola del calcolo letterale.