Gene Franean1_0951 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0951
Symbol
ID	5669365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1114622
End bp	1116142
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	72%
IMG OID	641239879
Product	gamma-aminobutyraldehyde dehydrogenase
Protein accession	YP_001505313
Protein GI	158312805
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR03374] 1-pyrroline dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0829268
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.201547
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACGGA CACCGATGGA ACGGACACCC ATGGAACGGA CACCCATGGA ACGGACGCTG 
AGCAATTTCG TCGGGGGGAA GCAGGCACCG TCGCTGGACG GGCGGACGAT GCCGGTGCTC 
AATCCCGCCA CCGGCGAGGT CCTCGCGCAC GCGCCGAGCT CCGGGCCGGC CGACGTGGAC 
GCCGCCGTGC GGGCCGCCGG TGAGGCGTTC GAGGGCTGGC GGGACAGCAC GCCGAGCGAG 
CGCTCCCGTG CCCTGCTCCG CCTCGCCGAC GCCGTCGAGG AACGGGCGGC CGAGATCGCC 
GACGTGGAGT GCGCGAACAC CGGCAAGCCG CGCCAGCTCA CCCTTGACGA GGAGATCGCC 
CCGTCGGCCG ACCAGATCCG GTTCTTCGCC GGGGCGGCGC GGCTGCTGGA GGGCCGGTCG 
GCGGGGGAGT ACCTGGCGGG CCACACCAGC TACGTCCGGC GTGAGCCGAT CGGTGTCTGC 
GCCCAGGTGA CCCCCTGGAA CTACCCGCTG ATGATGGCCG TCTGGAAGAT CGCCCCGGCG 
TTGGCGGCCG GGAACACGGT CGTGCTCAAG CCCGCGGAGA CCACGCCCGC CAGCTCGCTG 
CTGCTCGCCG AGATCGCGGC CGAGATCCTC CCGCCGGGTG TGCTCAACGT GGTCTGTGGT 
GACCGGGACA CCGGCCGCGC CCTCGTCGCC CACCCGGGCC CGGCGATGAT TTCGGTGACG 
GGCAGCGTGC GCGCGGGCAT GGAGGTCGCA CGAGGGGCGG CCGACTCGCT CAAGCGGGTA 
CACCTCGAGC TCGGAGGCAA GGCCCCGGTG ATCGTCTTTG ATGACGTCGA CCCGGCCGTG 
GTCGCCGCGG AGATCGCCGG GGCGGCGTAC TTCAACGCCG GCCAGGACTG CACGGCCGCG 
ACCCGGGTGC TCGCCGGGCC CGGCATCGCG GGCGAGCTCG CCGACGCGCT CGCCGAGGCC 
GCCCGCGCCA CCACGACCGG CCCGCCCGCC GCCGGCGGCC AGACCGGCGG CCAGACCGGC 
GGGGCCGCGG CCGGCGGAGG CGAGGCCGAC TACGGCCCGC TGAACAGCGC CGGTCAGCTC 
GGCCGGGTCA GTGGGTTCGT CGAGCGTGCC CCCGAGCACG CCCGCCTGCT CGCGGGCGGG 
ACGCCGCTGG ACCGGCCCGG CTACTTCTAC CCGGCCACCG TGATCGCCGG CCTGCGCCAG 
GACGACGAGC TGATCCAGCA GGAGGTGTTC GGCCCGGTCG TCACCGTCCA GGAGTTCTCG 
GCCGAGGACG AGGCGGTCGC GTGGGCGAAC GGGGTCGAGT ACGGCCTCGC CTCCAGTGTC 
TGGACGCGTG ACCACTCCCG CGCGATGCGG GTGGCGCGCC GCCTCGACTT CGGGTGCGTA 
TGGGTCAACA CGCACATTTC CATCGTTGCG GAGATGCCAC ATGGAGGATT CAAGAAGAGC 
GGTTACGGAA AGGACCTGTC GGTCTACGGG CTGGAGGACT ACACCCGTAT CAAGCACGTG 
ATGCACAACA TCGAGTTCTA G

Protein sequence

MERTPMERTP MERTPMERTL SNFVGGKQAP SLDGRTMPVL NPATGEVLAH APSSGPADVD 
AAVRAAGEAF EGWRDSTPSE RSRALLRLAD AVEERAAEIA DVECANTGKP RQLTLDEEIA 
PSADQIRFFA GAARLLEGRS AGEYLAGHTS YVRREPIGVC AQVTPWNYPL MMAVWKIAPA 
LAAGNTVVLK PAETTPASSL LLAEIAAEIL PPGVLNVVCG DRDTGRALVA HPGPAMISVT 
GSVRAGMEVA RGAADSLKRV HLELGGKAPV IVFDDVDPAV VAAEIAGAAY FNAGQDCTAA 
TRVLAGPGIA GELADALAEA ARATTTGPPA AGGQTGGQTG GAAAGGGEAD YGPLNSAGQL 
GRVSGFVERA PEHARLLAGG TPLDRPGYFY PATVIAGLRQ DDELIQQEVF GPVVTVQEFS 
AEDEAVAWAN GVEYGLASSV WTRDHSRAMR VARRLDFGCV WVNTHISIVA EMPHGGFKKS 
GYGKDLSVYG LEDYTRIKHV MHNIEF