Site http://www.epsilon-publi.net/
- espace http://www.epsilon-publi.net/b/bycart/ de B. Ycart, professeur de mathématique, Université Joseph-Fourier
Pour visualiser le document avec epsilonwriter, cliquer ici |
Dérivabilité et convexité
Bernard Ycart
Sommaire
D'accord, vous n'avez pas attendu ce chapitre pour dériver des fonctions. Attention cependant à deux nouveautés importantes : le théorème des accroissements finis et la convexité. Une bonne maîtrise de la notion de limite vous sera indispensable pour tout comprendre.
On considère une fonction , de
dans
, définie sur un intervalle ouvert
. Soit
un point de
.
Définition 1 On appelle taux d'accroissement de en
, la fonction
suivante.
![]() |
![]() |
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Si , la valeur de
est le rapport de l'accroissement de la fonction,
, à l'accroissement de la variable
. Sur le graphe de la fonction, c'est la pente de la droite passant par les points du graphe
et
. Cette droite s'appelle une sécante. Si
est un intervalle de temps et
désigne la position d'un point mobile au temps
,
est la vitesse moyenne du mobile sur l'intervalle
(distance parcourue divisée par le temps de parcours).
Définition 2 On dit que est dérivable en
si le taux d'accroissement
converge, quand
tend vers
. Si c'est le cas, sa limite est la dérivée de
en
et se note
.
La dérivée de
est la fonction
, qui à un point associe la dérivée de
en ce point, si elle existe.
Géométriquement, la valeur de la dérivée en est la pente de la tangente en
à la courbe d'équation
(figure 1). Si
est la position d'un mobile à l'instant
,
est sa vitesse instantanée à l'instant
.
Voici deux cas particuliers.
Si
est constante, ses taux d'accroissements sont nuls, et donc sa dérivée en tout point est nulle.
Si
est linéaire, ses taux d'accroissements sont constants, et donc sa dérivée en tout point est constante.
Il est souvent commode de se ramener à des limites en , en écrivant :
Voici une écriture équivalente.
Proposition 1 La fonction admet
comme dérivée en
si et seulement si, au voisinage de
pour
:
Le taux d'accroissement admet
pour limite en
si et seulement si :
Par définition, ceci équivaut à dire que est négligeable devant
, au voisinage de
:
Définition 3 On dit que la fonction admet un développement limité d'ordre 1 en
si :
Dire que admet un développement limité d'ordre
au voisinage de
, c'est donner une approximation : on affirme par là que, si
est petit,
peut être approché par la valeur de
en
,
, plus un terme linéaire
. La différence entre
et cette approximation est négligeable devant
.
Si est dérivable en
, elle est nécessairement continue en ce point.
Proposition 2 Si est dérivable en
, alors
est continue en
.
Écrivons le développement limité d'ordre :
On en déduit
ce qui équivaut à :
Voici un premier exemple.
Proposition 3 Soit un entier fixé. La fonction
est dérivable en tout point
où elle est définie, et :
Si la fonction est constante et sa dérivée est nulle. Supposons
. Écrivons le taux d'accroissement de
en
. Pour
:
La somme contient
termes, dont chacun tend vers
quand
tend vers
.
Considérons maintenant la fonction , définie pour
. Son taux d'accroissement en
s'écrit :
La somme contient termes, dont chacun tend vers
quand
tend vers
. Le taux d'accroissement a donc pour limite
Prenons par exemple et
. On obtient :
L'expression exacte est :
Si
est petit (pensez
), la valeur approchée
est effectivement très proche de la valeur exacte
.
Il peut se faire que le taux d'accroissement admette seulement une limite unilatérale en , auquel cas on parle de dérivée à gauche ou de dérivée à droite.
Définition 4 On dit que est dérivable à gauche (respectivement : dérivable à droite) en
si le taux d'accroissement
admet une limite à gauche (respectivement : à droite) en
. Si c'est le cas, sa limite est la dérivée à gauche de
en
(respectivement : dérivée à droite de
en
).
Considérons par exemple la fonction valeur absolue . Son taux d'accroissement en
est :
La fonction n'est donc pas dérivable en
, mais elle admet une dérivée à gauche égale à
, et une dérivée à droite égale à
.
Il se peut aussi que la fonction ne soit définie que sur un intervalle dont est une borne, auquel cas, on ne peut espérer qu'une dérivée unilatérale. Considérons la fonction suivante.
![]() |
![]() |
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Son taux d'accroissement en est défini, pour
, par
et donc :
La fonction
admet une dérivée à gauche et une dérivée à droite en
, mais elles sont différentes :
n'est pas dérivable en
.
Considérons maintenant le taux d'accroissement en . Pour
, il vaut :
et donc :
La fonction
n'admet pas de dérivée à gauche en
. Le fait que la limite du taux d'accroissement soit
se traduit par une tangente verticale à la courbe représentative (figure 2).
Les résultats de cette section sont à connaître par cœur : ils vous permettent de calculer les dérivées de toutes les fonctions que vous rencontrerez, à partir d'un petit nombre de dérivées usuelles.
Théorème 1 Soient et
deux fonctions définies sur un intervalle
contenant
. On suppose que
et
sont dérivables en
. Alors :
est dérivable en
, de dérivée
est dérivable en
, de dérivée
.
Comme cas particulier du point , si
est une constante, la dérivée de
est
. Par hypothèse,
Écrivons le taux d'accroissement de la somme. Comme la limite de la somme est la somme des limites, le résultat s'ensuit.
Écrivons le taux d'accroissement du produit. Comme
est dérivable, elle est continue en
, donc
tend vers
quand
tend vers
. La limite d'un produit est le produit des limites, idem pour la somme. D'où le résultat.
Le théorème 1, combiné avec la proposition 3, entraîne en particulier que toute fonction polynôme est dérivable sur .
Théorème 2 Soit une fonction définie sur un intervalle ouvert
de
, dérivable en
. Soit
une fonction définie sur un intervalle ouvert contenant
, dérivable en
. Alors la composée
est dérivable en
, de dérivée :
Par hypothèse, les taux d'accroissement de en
et de
en
convergent :
Nous allons utiliser en plus les conséquences suivantes :
C1 : est continue en
,
C2 : si alors
au voisinage de
,
C3 : le taux d'accroissement de est borné au voisinage de
.
L'idée consiste à écrire le taux d'accroissement de en
comme un produit de deux taux :
avec :
Évidemment, n'est défini que si
. Mais si
, alors
.
Considérons d'abord le cas où . Dans ce cas,
tend vers
, et comme conséquence de C1 et C3, il existe un intervalle
et une constante
telle que :
Donc
converge vers
.
Considérons maintenant le cas où . Comme conséquence de C2,
est bien défini au voisinage de
. La convergence de
vers
découle de la dérivabilité de
et de la continuité de
(composition des limites).
D'après la proposition 3, appliquée à la fonction inverse , celle-ci est dérivable en tout point
où elle est définie, et
.
On déduit du théorème 2 que si est dérivable et ne s'annule pas en
, alors son inverse
est dérivable, de dérivée
En combinant ceci avec la formule donnant la dérivée d'un produit, on obtient la dérivée d'un quotient.
Attention à ne pas confondre l'inverse avec la fonction réciproque
dans le cas où
est bijective.
Proposition 4 Soit une bijection d'un intervalle ouvert
vers un intervalle ouvert
. Soit
un point de
et
. Si
est dérivable en
, de dérivée non nulle, alors la fonction réciproque
est dérivable en
, et :
Pour tout point de
, il existe un unique
tel que
. Écrivons le taux d'accroissement de
en
: pour tout
,
Puisque
est continue en
,
est continue en
, et donc
Les théorèmes de cette section permettent de démontrer la dérivabilité de toutes les fonctions que vous aurez à examiner, à condition d'admettre la dérivabilité des «briques de base» que sont les fonctions usuelles.
Toutes les fonctions usuelles sont dérivables en tout point d'un intervalle ouvert où elles sont définies.
Ceci concerne les fonctions polynômes, fractions rationnelles, puissances, exponentielle, logarithme, sinus, cosinus, mais exclut bien sûr la valeur absolue.
Voici un tableau récapitulatif des formules de dérivation à connaître par cœur.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Les dérivées suivantes doivent être connues.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
La connaissance des dérivées usuelles, permet, en appliquant la définition def:derivee, de calculer des limites de taux d'accroissement. À titre d'exemple, nous donnons ci-dessous trois limites à connaître.
Théorème 3 Au voisinage de ,
,
et
sont équivalents à
.
Les trois limites sont démontrées dans l'ordre.
La dérivée de la fonction sinus en est
. Son taux d'accroissement en
est :
D'où le résultat.
La dérivée de la fonction exponentielle en est
. Son taux d'accroissement en
est :
D'où le résultat.
La dérivée de la fonction en
est
. Son taux d'accroissement en
est :
D'où le résultat.
Etant donné un intervalle ouvert , on dit que
est dérivable sur
, si elle est dérivable en tout point de
. Soit
une fonction dérivable sur
. Sa dérivée
peut être elle-même dérivable. On appelle alors dérivée seconde la dérivée de
, et on la note
. Cette fonction peut être elle-même dérivable, etc. Si
est
fois dérivable, on note
sa dérivée d'ordre
, ou dérivée
-ième. Par définition, la dérivée d'ordre
est la fonction elle-même.
Par exemple, si est un entier fixé, et
est la fonction
,
Vous rencontrerez souvent les notations suivantes, que nous n'utiliserons pas ici.
Définition 5 Soit une fonction définie sur un intervalle
de
. On dit que
est de classe
sur
, ou encore
est
fois continûment dérivable, si elle admet une dérivée
-ième continue sur
.
On dit que est de classe
sur
, si elle admet des dérivées successives de tout ordre (elles sont nécessairement continues puisque dérivables). Vous pouvez retenir que :
toutes les fonctions usuelles sont de classe sur les intervalles ouverts où elles sont définies.
Ceci concerne les fonctions polynômes, fractions rationnelles, puissances, exponentielle, logarithme, sinus, cosinus.
La formule de Leibniz, très proche de la formule du binôme de Newton, exprime la dérivée -ième d'un produit à d'aide des dérivées successives des composantes.
Proposition 5 Si et
sont deux fonctions de
dans
,
fois dérivables sur un intervalle
, alors le produit
est
fois dérivable sur
et :
par récurrence sur . Puisque par définition
, la formule est vraie pour
. Supposons qu'elle est vraie pour
. Si
et
sont dérivables
fois sur
, alors pour tout
, le produit
est dérivable et sa dérivée est :
D'après (leibniz),
est dérivable, comme combinaison linéaire de fonctions dérivables. Sa dérivée s'écrit :
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Pour la dernière égalité, nous avons appliqué la formule du triangle de Pascal. La formule est vraie pour , donc pour tout
, par récurrence.
À titre d'exemple, calculons la dérivée -ième de
. Posons
et
. Alors :
et
Par application de 1,
En un point où la dérivée d'une fonction s'annule, les accroissements de la fonction sont négligeables devant les accroissements de la variable. Souvent, c'est un point où les variations de la fonction changent de sens, donc un maximum ou un minimum.
Définition 6 Soit une fonction de
dans
, définie sur un intervalle ouvert
. Soit
un point de
. On dit que
est un
maximum local de
si
minimum local de
si
Insistons sur l'adjectif local. Il suffit que la valeur de en
soit la plus grande des valeurs prises par
sur un petit intervalle autour de
pour que
soit un maximum local. Cette valeur n'est pas nécessairement la plus grande prise par
sur tout son domaine de définition (voir le graphe de la figure 3).
Théorème 4 Soit une fonction de
dans
, définie sur un intervalle ouvert
. Si
présente un extremum (maximum ou minimum) local en un point
de
, et si
est dérivable en
, alors
.
Si est un minimum local de
, alors c'est un maximum local de
: quitte à remplacer
par
, nous pouvons supposer que
est un maximum local.
Donc pour tout
dans l'intervalle
,
donc
Pour tout dans l'intervalle
,
donc
D'où le résultat.
Reprenons l'exemple de la figure fig:tanhorver : . La dérivée est :
Elle s'annule en
, et
admet effectivement un maximum en ce point. Mais savoir que
permet seulement d'affirmer que la tangente en ce point est horizontale. Il se pourrait que la dérivée en un point soit nulle sans que la fonction admette un extremum en ce point : par exemple la fonction
en
. D'autre part, une fonction peut présenter un extremum en
, sans être dérivable en ce point (par exemple la fonction
en
).
Voici un autre exemple (figure 3). Soit la fonction définie par :
![]() |
![]() |
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Le taux d'accroissement de en
est
, qui tend vers
. La dérivée de
en
est donc nulle. Pourtant, tout intervalle contenant
, contient aussi des valeurs positives, et des valeurs négatives (et aussi une infinité d'extrema locaux).
Nous allons appliquer le théorème 4, pour démontrer le théorème de Rolle.
Théorème Soient
et
deux réels tels que
. Soit
une fonction de
dans
, continue sur
, dérivable sur
. Si
, alors la dérivée de
s'annule sur
.
Une application continue sur intervalle fermé borné, atteint sa borne inférieure et sa borne supérieure
: il existe
tels que pour tout
,
Si
, l'application
est constante sur
, et sa dérivée est identiquement nulle. Si
, alors l'une au moins de ces deux valeurs est différente de
(et donc de
). Si
, alors
est un minimum pour
, et donc
, d'après le théorème précédent. Si
, alors
est un maximum pour
, et donc
.
On en déduit le résultat le plus important de cette section, le théorème des accroissements finis.
Théorème 6 Soient et
deux réels tels que
. Soit
une fonction de
dans
, continue sur
, dérivable sur
.
Considérons la fonction , qui à
associe
La fonction
est continue sur
, dérivable sur
. De plus, elle prend la même valeur en
et
:
D'après le théorème de Rolle, la dérivée de
s'annule en un point
de
.
D'où le résultat.
Graphiquement, le théorème des accroissements finis dit que la courbe représentative de sur
possède au moins une tangente parallèle à la sécante passant par
et
(figure 5). Si
représente la position d'un mobile à l'instant
, le théorème des accroissements finis dit que en au moins un point, la vitesse instantanée doit être égale à la vitesse moyenne sur l'intervalle.
Le plus souvent en pratique, on ne sait rien de la valeur de qui est telle que la tangente en
est parallèle à la sécante. Mais de son existence découlent des inégalités permettant d'obtenir des renseignements précis sur les accroissements de la fonction. Le théorème des accroissements finis permet aussi d'établir le lien entre le sens de variation de
et le signe de sa dérivée.
Proposition 6 Soit un intervalle ouvert non vide, et
une fonction dérivable sur
. La fonction
est :
croissante sur
si et seulement si
est positive ou nulle sur
,
décroissante sur
si et seulement si
est négative ou nulle sur
.
La fonction est croissante si et seulement si
est décroissante. Il suffit donc de démontrer le premier point. Si
est croissante, alors ses taux d'accroissement sont tous positifs ou nuls :
Comme la dérivée en chaque point est limite de taux d'accroissement, elle est aussi positive ou nulle.
Réciproquement, soient et
deux points de
tels que
. Appliquons le théorème des accroissements finis à
sur l'intervalle
: il existe
tel que :
Donc
.
Ce résultat n'est valable que sur un intervalle : la fonction a une dérivée négative sur
, pourtant elle n'est pas décroissante. D'autre part, si la dérivée est strictement positive, alors la fonction est strictement croissante. La réciproque est fausse. La fonction peut être strictement croissante même si la dérivée s'annule en certains points (par exemple
).
Comme autre application du théorème des accroissements finis, il est possible d'obtenir la dérivée en un point comme prolongement par continuité de la dérivée calculée sur un intervalle.
Proposition 7 Soient et
deux réels tels que
. Soit
une fonction de
dans
, continue sur l'intervalle
, dérivable sur
. Si
admet une limite finie en
, alors
est dérivable à droite en
et :
Soit . Appliquons le théorème des accroissements finis sur l'intervalle
. Il existe
tel que
Soit
la limite à droite de
en
. Pour tout
, il existe
tel que
Donc pour
,
D'où le résultat.
Ce résultat n'est qu'une condition suffisante. Il peut se faire que la dérivée existe sans qu'elle soit continue. Par exemple la fonction a une dérivée nulle en
(figure 3). Pourtant sa dérivée en
,
, n'a pas de limite en
.
Définition 7 Soit une fonction de
dans
, définie sur un intervalle
contenant au moins deux points. On dit que
est convexe sur
si et seulement si :
(2)
Si , et
, alors
est un point de l'intervalle
. La condition
dit que le point de la courbe représentative d'abscisse
doit être situé au-dessous du segment de sécante joignant les points
et
(figure 6). En d'autres termes, tout arc de la courbe représentative doit être situé au-dessous de sa corde. De manière équivalente, la partie du plan située au-dessus de la courbe représentative est une région convexe, au sens où tout segment joignant deux de ses points est entièrement contenu dans la région.
Une fonction est dite concave si son opposée est convexe. Les propriétés sont inversées : tout arc est au-dessus de sa corde. La région du plan située au-dessous de la courbe représentative est convexe.
La fonction exponentielle est convexe, la fonction logarithme est concave. La fonction est convexe sur
pour
, elle est concave pour
. La fonction
est convexe sur
, concave sur
, de même que la fonction
.
Voici une autre caractérisation de la convexité.
Proposition 8 prop:caracconvexe Soit une fonction de
dans
, définie sur un intervalle
contenant au moins deux points. La fonction
est convexe sur
si et seulement si, pour tout
le taux d'accroissement
est une fonction croissante de
sur
.
Commmençons par la condition nécessaire. Soit et
tels que
. Trois cas sont possibles :
,
,
. Nous traitons le premier, les deux autres sont analogues. Soit
. Alors
. Comme
est convexe,
On en déduit :
soit :
Montrons maintenant la condition suffisante. Soient
et
deux points de
tels que
et
un réel dans
. Posons
, et donc :
Si
ou
, l'inégalité est vérifiée. Nous pouvons donc supposer que
est différent de
et
. Écrivons que le taux d'accroissement en
est croissant.
En multipliant les deux membres par le produit
, qui est positif, on obtient :
En divisant par
ceci donne :
Corollaire 1 Si une fonction est convexe sur un intervalle ouvert
, alors elle est dérivable à gauche et à droite en tout point de
, et donc continue sur
.
Si , le taux d'accroissement en
,
, est une fonction croissante de
. Il admet donc en
une limite à gauche et une limite à droite finies.
Ce résultat n'est pas valable si l'intervalle n'est pas ouvert. Par exemple la fonction qui vaut sur
, et
au point
est convexe sur
, mais elle n'est pas continue en
. Le fait qu'une dérivée à gauche et à droite existe, n'implique pas que la fonction soit dérivable. Par exemple, la fonction valeur absolue
est convexe sur
mais elle n'est pas dérivable en
. Lorsque la fonction est dérivable, sa dérivée est croissante.
Proposition 9 Soit une fonction de
dans
, dérivable sur un intervalle ouvert
. La fonction
est convexe sur
si et seulement si sa dérivée
est croissante sur
.
Commençons par la condition nécessaire. Soient et
deux points de
, tels que
. Pour tout
,
En faisant tendre
vers
, on en déduit :
De même, en faisant tendre
vers
,
Donc
.
Montrons maintenant la condition suffisante. Soient deux points de
tels que
,
, et
. Appliquons le théorème des accroissements finis sur les deux intervalles
et
. Il existe
et
tels que :
La fonction
étant croissante, on a donc :
Comme nous l'avons déjà vu dans la démonstration de la proposition prop:caracconvexe, ceci entraîne
Graphiquement, la pente de la tangente d'une fonction convexe est croissante. Dans la démonstration précédente, nous avons établi les inégalités : On en déduit que pour
,
Donc la courbe représentative de
reste au-dessus de ses tangentes (figure fig:convexe).
Corollaire 2 Soit une fonction de
dans
, deux fois dérivable sur un intervalle ouvert
. La fonction
est convexe sur
si et seulement si sa dérivée seconde
est positive ou nulle sur
.
Une fonction deux fois dérivable est concave si et seulement si sa dérivée seconde est négative ou nulle. Les points où la dérivée seconde s'annule et change de signe correspondent graphiquement à des points où la courbe représentative passe de concave à convexe où inversement. On les appelle des points d'inflexion.