Gene Synpcc7942_1441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1441
Symbol	cobD
ID	3773613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1495174
End bp	1496151
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	59%
IMG OID	637799873
Product	cobalamin biosynthesis protein
Protein accession	YP_400458
Protein GI	81300250
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1270] Cobalamin biosynthesis protein CobD/CbiB
TIGRFAM ID	[TIGR00380] cobalamin biosynthesis protein CobD

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.282346
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.506208
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTCTG CGTCACTGAC GACGATCGCG GTCTTGGGGT TGGCGGCCTT GCTGGATTAC 
GGTGTCGGCG ATCCCTGGGG TTGGCCGCAT CCGGTGCAGG CTTTGGGCTG GGTCATTGCT 
TGCTGGCGCG ACTGGACGTT TCGCTGGCTG AAATCTGCGA TCGCTCAGCG GATCTCAGGC 
ATGGTCCTGA CGATTGTTCT GGTGGCTGGT AGCGCGATCG CTAGCTGGGT TGCTTTTGGG 
GCGATCGCTC GTCTCTCACC ACTCCTCTCG GCAGGTCTGC AAGTGATTCT GCTGGCAAGC 
TGTTTCGCCG GTCGCAGCTT GCGGGAAGCA GCTGCGGAAG TTCTGAAACC CCTAGCTGCT 
GAGGATTTGC CAGCAGCTCG AAGGGCACTG AGTCGCTACG TGGGCCGCGA TACTGATCAG 
CTGTCGGCGC TCGAAATTCA GCGAGCGGTG CTGGAAACGG TGACTGAAAA TTCGACGGAT 
GGTGTTTTGG CACCACTGTT CTATGCCGGA TTAGGAGTAT TGCTGGGACT TGGCCCTGTT 
CCGTTGGCGA TCGCCTATAA GGCTGCCAGC ACCTTGGATT CGATGGTGGG CTACCGCCGC 
CCGCCCTACA CGAACCTAGG TTGGTTTCCA GCTCGTAGCG AGGATGTCTG GACTTGGTTG 
CCCTGCCGCT TGGTGGTGCT GACGATCGCG CTATTCAGTG GTCAGCCCCG ACAGGTCTGG 
CAAATTTGCT GCCGCGATGC TCCGGCGGAT CCCAGTCCCA ATGCAGGCTG GAGCGAAGCG 
GCCTACGCAG CTGCGCTGGG GGTTCAAGTC GGCGGCGACA ACGTCTACCA AGGTCAAATC 
GTCTCGAAGC CGCTACTGGG GGATCCACAG CGATCGCTGG ATGCCACAGT CATTCAGCAA 
GCCTTGCAGT TAACCCGCAT CGCTTTTTTG CTTTGGTTAG CTGTGATCGC GGGACTGCTA 
CTAGCGTTGG GGCATTAG

Protein sequence

MMSASLTTIA VLGLAALLDY GVGDPWGWPH PVQALGWVIA CWRDWTFRWL KSAIAQRISG 
MVLTIVLVAG SAIASWVAFG AIARLSPLLS AGLQVILLAS CFAGRSLREA AAEVLKPLAA 
EDLPAARRAL SRYVGRDTDQ LSALEIQRAV LETVTENSTD GVLAPLFYAG LGVLLGLGPV 
PLAIAYKAAS TLDSMVGYRR PPYTNLGWFP ARSEDVWTWL PCRLVVLTIA LFSGQPRQVW 
QICCRDAPAD PSPNAGWSEA AYAAALGVQV GGDNVYQGQI VSKPLLGDPQ RSLDATVIQQ 
ALQLTRIAFL LWLAVIAGLL LALGH