Gene Franean1_3707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3707
Symbol
ID	5672073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4389431
End bp	4390618
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	71%
IMG OID	641242590
Product	L-carnitine dehydratase/bile acid-inducible protein F
Protein accession	YP_001508010
Protein GI	158315502
COG category	[C] Energy production and conversion
COG ID	[COG1804] Predicted acyl-CoA transferases/carnitine dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGCTG GTCCGCTGTC GGGCGTTCGG GTCGTCGATC TGACCGCGAT GGTCATGGGT 
CCCCACTGCA CGCAGATCAT GGCCGACATG GGGGCGGACG TGATCAAGAT CGAGCCCCCC 
GCCGGCGACA ACACCCGCTA CATCTCGGTC GGGCCGGAGC CCGCCATGGG CGGCGTGTTC 
GTCAACGTCA ACCGCGGCAA ACGCGGCGTC GTGCTGGACC TGCGCTCCGA CGAGGGCCGG 
GACGCGCTGC GCGGGCTCGT CGCGGGCGCG GACGTGTTCG TCCACTCGAT GCGGGCGAAG 
GCGATCGCCG GGCTCGGCTT CTGCTACGAC GAGGTGGCCG CGATCAACCC GTCGATCGTC 
TACACCAACT GCTACGGGTA CGGGCGGCGC GGCCCGGACG CCGACCTCAC CGCCTACGAC 
GACACGATCC AGGCGGAGTG CGGGCTGCCG TTCGCCCAGG AGCAGCTGAC CGGCGAGTCG 
AGCTACGTGG GCACCATCCT CGCCGACAAG GTCGCCGGGC TGACCGCCCT CTACGCCACC 
GTGATGGCAC TGTTCCACCG CGAGCGCACC GGCGAGGGGC AGGAGGTCGA GGTCGCCATG 
TTCGAGACCA TGGCCGCCTT CATGCTGGTC GAGCACGCCA ACGGTGCGAT GTTCACCCCG 
CCGCTGGGCC CCGCGCTCTA CCCTCGCGCG GTGACCCCGA ACCGCCGGCC CTACCGCACC 
CGCGACGGCC AGATCTCCGC GCTGGTCTAC AACGACAAGC AGTGGTCCGC CTTCGTCGGC 
GCCGTGCGGC CGGAATGGGC CGGCGAGCAG TTCGCCACCC TCGCCCAGCG TGCCCGCCGG 
ATCGACGTCG TCTACGCCCT GCTGGCCGAG ACGTTCCTGC AGCGCACGAC GAAGGAGTGG 
CTCGACCTGC TGCGCTCCCT CGACATCCCC GCCGCGCCGG TGCGCACGCT CGACGAGCTC 
TTCGACAACC CGCACCTCAA CGAGGCGGGC TTCTTCGAGA CGGTGCAGAC CCCGAACGGC 
CCGGTGCGGT TTCCCGGAAT CCCGACCTGG TTCTCGCGGA CACCTGGACG GGTCGCCGGC 
CCCGCGCCCA GGCTCGGCGA GCACACCCGG GAGGTCCTCG ACGAGCTCGG CGGGGAGTCC 
GGGCGGCCGT CCCCGCAGCC GCGGTCCGCT CGACCAGATG GAGGTTGA

Protein sequence

MKAGPLSGVR VVDLTAMVMG PHCTQIMADM GADVIKIEPP AGDNTRYISV GPEPAMGGVF 
VNVNRGKRGV VLDLRSDEGR DALRGLVAGA DVFVHSMRAK AIAGLGFCYD EVAAINPSIV 
YTNCYGYGRR GPDADLTAYD DTIQAECGLP FAQEQLTGES SYVGTILADK VAGLTALYAT 
VMALFHRERT GEGQEVEVAM FETMAAFMLV EHANGAMFTP PLGPALYPRA VTPNRRPYRT 
RDGQISALVY NDKQWSAFVG AVRPEWAGEQ FATLAQRARR IDVVYALLAE TFLQRTTKEW 
LDLLRSLDIP AAPVRTLDEL FDNPHLNEAG FFETVQTPNG PVRFPGIPTW FSRTPGRVAG 
PAPRLGEHTR EVLDELGGES GRPSPQPRSA RPDGG