Gene Franean1_1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1959
Symbol
ID	5670360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2355212
End bp	2356321
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	73%
IMG OID	641240880
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_001506302
Protein GI	158313794
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.166829
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.79155
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGTC CGCTGAGCGG ATTGCGGGTC GTCGAGCTCG CCGGCATCGG CCCCGGCCCG 
CACGGCGCGA TGATCCTCGC CGACCTCGGC GCGGACGTCG TGCGGATCCA ACGTCCCGAG 
CTGGGCGACG GGCCCGACGA CCTCCAACTG CGCGGCCGGC GCATCGTCCG GGTGGACCTG 
CGCTCCGCCG ACGGACGGGA GCAGGTGCTG GGCCTGGTCG AGCGGGCCGA CGTGCTCATC 
GAGGGCTACC GGCCGGGCGT GACCGAGCGG CTCGGCCTCG GCCCGGCGGA CTGCCAGGCC 
CGCAACCCCC GCCTGGTCTA CGCGCGGATG ACCGGGTGGG GGCAGACCGG CCCGCTGGCC 
AACCGCGCCG GTCACGACAT CAACTACATC TCGCTGACCG GTGCGCTGCA TGCCATGGGC 
GAGGCCGGGC AGCGCCCGCC GGTGCCGCTG AACCTCGTCG GGGACTACGG CGGCGGCTCG 
ATGTTCCTGT TGGTGGGGAT CCTCTCCGCG CTGCTGGAAC GCGAGCGGTC CGGCGAGGGC 
CAGGTGATCG ACGCGGCGAT CGTGGACGGC ACCAACGTCC TGACGCAGAT GATGTGGGCC 
TGGCGTGGCA TGGGCGACTG GCACGGGTTC GGGGACTGGT CCGATGAGCG CGGGGTGAAC 
CTGCTCGACG GCAGCCGGCC GTTCTACGAC ACCTACACCT GCGCCGACGG CCGTTTCGTG 
GCCGTCGGGC CGCTGGAGCC GCAGTTCTAC GCCCGGCTGC TGGAGGTGCT CGGTCTCGCT 
GACGCGGGCC TGCCCGACCA GTTCGACCCG ACTGGGTGGC CGGTGCTGCG GGACGCCTTC 
ACCAAGGCCT TCGCCGCCCG CACCCGCGAC GAGTGGACGG AGATCTTCGC GGACACCGAC 
GCCTGCGTCA CGCCGGTGCT GAGCTTCGCC GAGGTGCAGG ACCACCCGCA CATGGCCGAC 
CGCGGCGCCG TCGTGCACAC CGACGGGATG GCCCAGGCGG CACCCGCGCC GCGCTTCTCG 
CGCAGCACCA CCGCGCTACC GGGCCGCGCG GTCGTCGGCG ACCCGGCAGC GATCATGGAC 
GAATGGGCGA AGCCACCGTC AGCGGGCTGA

Protein sequence

MTGPLSGLRV VELAGIGPGP HGAMILADLG ADVVRIQRPE LGDGPDDLQL RGRRIVRVDL 
RSADGREQVL GLVERADVLI EGYRPGVTER LGLGPADCQA RNPRLVYARM TGWGQTGPLA 
NRAGHDINYI SLTGALHAMG EAGQRPPVPL NLVGDYGGGS MFLLVGILSA LLERERSGEG 
QVIDAAIVDG TNVLTQMMWA WRGMGDWHGF GDWSDERGVN LLDGSRPFYD TYTCADGRFV 
AVGPLEPQFY ARLLEVLGLA DAGLPDQFDP TGWPVLRDAF TKAFAARTRD EWTEIFADTD 
ACVTPVLSFA EVQDHPHMAD RGAVVHTDGM AQAAPAPRFS RSTTALPGRA VVGDPAAIMD 
EWAKPPSAG