Gene Franean1_3312 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3312
Symbol
ID	5671684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3923712
End bp	3924932
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	71%
IMG OID	641242201
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_001507621
Protein GI	158315113
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.410057
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCCGG CGCCACTCGC CGGGGCACGG ATCCTGGAGG TGGCCTCGCA TGTGTTCGTC 
CCGATGGCCG GGGCCGTGCT CGCCGAGTGG GGCGCCGAGG TCATCAAGAT CGAGCACCCC 
GAGACCGGTG ATCCCTACCG TGGCCTGGTC ACAGCCGGTT TACACAAGTT GTGGCACGGC 
GTGGACGTCC AGTTCCAGGC CACGAACCGG GGCAAGCGAT CCGTCGCCCT GGATCTGAAG 
AATCCGGCCG GCCGGCAGCT GCTGTCCCGG CTCATCGCCG CGAGCGACGT CTTCGTGACC 
AACCTGCGCG CGGACACCCG CGCCCGGCTG AACCTCGAGC TGGCCGACGT CCGGGCCGAC 
AACCCCGCGG TGATCTATGT ACGGGGTACC GCGTTCGGTT CCCAGGGGCC CGACGCCGGC 
CGGGGCGGGT ACGACGCGGG CGCCTACTGG GCCCGCAGCG GAATGCAGCA GATCTTCACC 
GCCCCCGACG CGCCCTGGCC GGCCATGCCC CGCCCGGCGT TCGGGGACGT GGTCGGCGGG 
CTGAGCATCG CCGGTGCCAT CAGCGCGGCG CTCTACCACC GGTCGACGAC CGGCGAGCCC 
TCGACGGTCG ACGCCTCGCT GCTGGCGTCC GGAATGTGGC AGGTCCAGAT GGACCTCATG 
AACGCCACCC TCAACGGCCC CGGCGGGCCG GTCGCCGCCC GGAGCCGGTA CGAGGCCTCG 
AACCCGCTGA TGCTGCCGTA CCGCACGGCC GACGGCCGGG TCATCGTCCT GCAGATGCTC 
GCTCCCGACC GCTACTGGCC ACACCTGTGC AAGAGCATCG GTCAGCCAGC CGCGGCGAAC 
GACCCCCGGT TCGTGGACAT GGAGGCCCGC CGCCGCAACG CCCGGGAGTG CGTCGAGTGG 
CTCGAGGGCG TCTTCGCCGA ACGCACCTTC GACGAATGGC GGGCCGTCCT CGCGGAGTTC 
GACGGGGAGT GGGCGCCCAG CCAGTACCCC CACGAGCTCG CCGAGGACCC CCAGGTGAAG 
GCCAACGGCC TGTTCGCCGA CGTCGATCTC GGCAACGGCC ATTCCCTGCC GCTGGTGGCC 
ACGCCGGTGC AGTTCGACCA GCGGCCGAGC CAGCCCAGCC GTGCCCCCGA ACACGGTGAG 
CACACCGAAT CCGTACTCCT CGACCTCGGC CTCTCGTGGG ACGAGATCGG CGACCTCAAA 
GCCGGCGGGG CGATCCTCTG A

Protein sequence

MSPAPLAGAR ILEVASHVFV PMAGAVLAEW GAEVIKIEHP ETGDPYRGLV TAGLHKLWHG 
VDVQFQATNR GKRSVALDLK NPAGRQLLSR LIAASDVFVT NLRADTRARL NLELADVRAD 
NPAVIYVRGT AFGSQGPDAG RGGYDAGAYW ARSGMQQIFT APDAPWPAMP RPAFGDVVGG 
LSIAGAISAA LYHRSTTGEP STVDASLLAS GMWQVQMDLM NATLNGPGGP VAARSRYEAS 
NPLMLPYRTA DGRVIVLQML APDRYWPHLC KSIGQPAAAN DPRFVDMEAR RRNARECVEW 
LEGVFAERTF DEWRAVLAEF DGEWAPSQYP HELAEDPQVK ANGLFADVDL GNGHSLPLVA 
TPVQFDQRPS QPSRAPEHGE HTESVLLDLG LSWDEIGDLK AGGAIL