Gene Franean1_4864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4864
Symbol	cobD
ID	5673204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5836690
End bp	5837688
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	81%
IMG OID	641243719
Product	cobalamin biosynthesis protein
Protein accession	YP_001509135
Protein GI	158316627
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1270] Cobalamin biosynthesis protein CobD/CbiB
TIGRFAM ID	[TIGR00380] cobalamin biosynthesis protein CobD

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0377956
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.399913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCGCG CCCGCACGGT GGGGCTCGTC CTCGGCGCGG CCCTCGACGC GGTGCTCGCC 
GACCCTGCCC GCGGCCATCC CGTGGCCGGT TTCGGGCGGG TCGCCGGCGG CCTCGAGCGG 
GCCGTCCACC GTGACAGCCG GCTGGTCGGC GCGGCGTACG CCACGGTCCT CGTCGCCGGC 
ACGGGCGCCG CGGCCGCCGG CGCGGAACGG GCGCTGGCCG GCCGGCACCC GGGACGGCGG 
GCCGCGCTGG CCCGCGCGGG CCTGACCGCC GCCACGACCT GGACGGTGCT CGGCGGCACC 
TCGCTGCGGC GCCAGGGCCG GGCCCTCGGC GGCGAGCTGG AACGCCGCGA CCTGCGCGCG 
GCCCGGACGC GGCTGCCGTC GCTGTGCGGG CGGGACCCGT CGGCCCTCGA CGCCGGCGGG 
CTCGCGCGTG CCGGGGTGGA GTCGGTGGCG GAGAACACCT CGGACGCCGT CGTCGCCCCG 
CTGCTGTGGG GGGCCGTCGC CGGGCTGCCC GGGCTGGTGG CCTACCGCGC GGCGAACACC 
CTCGACGCGA TGGTCGGCTA CCGCGACGCC CGGCACGGCC GGTTCGGCTG GGCCGTGGCC 
CGGACCGACG ACGCGGCGAA CCTGCTGCCG GCCCGGATGT GCGCGCTGCT CACCTGCGCC 
TGCGCCCCGG TCGTCGGCGG TTCCCCGGCG GAGGCGTTCC GGGTGATGCG CCGCGACGGC 
CGATCGCATC CGAGCCCGAA CGCGGGCGTG GTCGAGGCCG CGTTCGCCGG TGCGCTCGGC 
CTGCGTCTCG GTGGTGAGCT GCGGTACCCG CACGGGGTCG AGCACCGTCC CGAGCTGGGG 
TCCGGGCGTC CGGCCGAAGC CGGCGACCTG GCGGCGGCGG CCCGTCTTTC CGGCGCGGTC 
AGCGCGGCCT CGGTCGTGGT GTGCGCCGGT GCGGTCGCCG CCCTCGACAC GTTGCGGGCG 
CGCCGGGCGG GCTCCCGCGG CCCGCGGGAG GCGGGATGA

Protein sequence

MSRARTVGLV LGAALDAVLA DPARGHPVAG FGRVAGGLER AVHRDSRLVG AAYATVLVAG 
TGAAAAGAER ALAGRHPGRR AALARAGLTA ATTWTVLGGT SLRRQGRALG GELERRDLRA 
ARTRLPSLCG RDPSALDAGG LARAGVESVA ENTSDAVVAP LLWGAVAGLP GLVAYRAANT 
LDAMVGYRDA RHGRFGWAVA RTDDAANLLP ARMCALLTCA CAPVVGGSPA EAFRVMRRDG 
RSHPSPNAGV VEAAFAGALG LRLGGELRYP HGVEHRPELG SGRPAEAGDL AAAARLSGAV 
SAASVVVCAG AVAALDTLRA RRAGSRGPRE AG