Gene Franean1_4517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4517
Symbol
ID	5672866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5389656
End bp	5390843
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	70%
IMG OID	641243382
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_001508798
Protein GI	158316290
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.196524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCGC TCGAAGGCGT GAAGGTGATT TGTGTGGGGC AGTTCTACTT TGCCCCTTAT 
TGCTCGATGC TGATGGCGCG CCTCGGCGCG GACGTCATCA AGGTCGAGGC GCCGGAGGGG 
GACCCGTACC GCCGGCTGCC CACCGTCGAC CACGACGGCT TCCCGATCCA GTTCCGGTTC 
CTCAACTCCG GCAAGCGCGC CATCCGGCTG GACCTCAAAC AACCTGCCGG GCAGGAGATA 
CTCCGTAACC TCGTCCGGAC CGCCGACGTG CTCGTCCAGA ACCTGTCGCC GGGGGCGATG 
GACCGGCGCG GTCTCGGCTA CAAGCAGCTC AGCGCGATCA ACCCGGGCCT GATCATGGCG 
TCGGGCACAG GCTTCGGGTC GTTCGGGCCC TATGCCGGCG AGCCGGCGAT GGATCTCACG 
ATCCAGGCGC GCAGCGCGAT CATGAGCACC ACGGGGTTCG CCGACGGGGC GCCGGTCCGC 
ACCGGCCCGT CGGTCGTCGA CTTCGTCGCG GGCACGCACA TGCTCGGGGG TGTGCTCGCC 
GCGCTGTTCC AACGCACCCG CACCGGCCGC GGTCAGCATG TCGAGGTGGC CCTGCAGGAC 
GCCATCGTCC CGTCGCTGAC GTCCAACATC GCCGGGCTGC TGAGCAGCGC GACCGAGAGC 
CACGAACGCA CGGGCAACCG GCACGGCGGG CTGGCCGTCG CCCCGTACAA CGCCTACCGC 
ACCAACGACG GGTGGATCGC CGTACTGTGC CCGACCGACG CGCACTGGCG GCGGCTGTGT 
GAGCTGATGG GGGATCCCGC CACCGACGAC CCGCGCTTCG CGGACATGAG CAGCCGGTGC 
GCCCACATAG ACGACGTCGA CGCGGTCGTC GAGAACTGGA CGAGGGCCCG CCCCAAGGAC 
CTGCTGGCGC GGATGCTGGT GGAGGCACGC ATCCCCTCCG CTCCGGTCGT CACCCTGCCG 
GAGCTGCTCG AGGACCCGCA CGTACGCGAG CGCGGCGTGC TTCGCACTGT CACCGACGAG 
CAGGGCTCGT TCATGACGCT CGGCAGTCCG CTGTTCCTGT CGGACTCGCC CATGGTGGAG 
CCGTGGCGGG CGCGCGAGGT CGGCGCCGAC ACCGACGAGG TCCTTACCGC GGAGCTGGGC 
ATGTCCGTCG ACGACATCGC CAAGCTGCGG GAGGCCGGGG TCATCTGA

Protein sequence

MTALEGVKVI CVGQFYFAPY CSMLMARLGA DVIKVEAPEG DPYRRLPTVD HDGFPIQFRF 
LNSGKRAIRL DLKQPAGQEI LRNLVRTADV LVQNLSPGAM DRRGLGYKQL SAINPGLIMA 
SGTGFGSFGP YAGEPAMDLT IQARSAIMST TGFADGAPVR TGPSVVDFVA GTHMLGGVLA 
ALFQRTRTGR GQHVEVALQD AIVPSLTSNI AGLLSSATES HERTGNRHGG LAVAPYNAYR 
TNDGWIAVLC PTDAHWRRLC ELMGDPATDD PRFADMSSRC AHIDDVDAVV ENWTRARPKD 
LLARMLVEAR IPSAPVVTLP ELLEDPHVRE RGVLRTVTDE QGSFMTLGSP LFLSDSPMVE 
PWRAREVGAD TDEVLTAELG MSVDDIAKLR EAGVI