Gene A9601_08401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_08401
Symbol	cobW
ID	4717545
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	728192
End bp	729256
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	28%
IMG OID	640078552
Product	putative cobalamin synthesis protein
Protein accession	YP_001009231
Protein GI	123968373
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID	[TIGR02475] cobalamin biosynthesis protein CobW

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.807692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA AAATACCAGT TATAGTTGTT TCAGGATTTC TTGGTTCAGG TAAAACAACT 
TTTCTAAGAT ATTTATTAAA AGAGAGTAAT AAAAAATTTG GTTTAATAAT TAATGAATTT 
GGTGATGTTG GAATTGACGG TGATTTGATT AAAAGTTGTG ATAAATGTGA TGAATCTGAA 
GACGACTGCG TAATCGAATT AAACAATGGA TGTTTATGTT GTACTGTTCA AGATGATTTT 
GTTCCATCAA TAAAAGCTCT CCTAGAATTT AATCCTCCTA TCGAATCAAT AATTATCGAA 
ACAAGTGGCT TGGCACTACC AATTCCCTTA ATTCAAGCAC TTAACTGGCC TGAAATTAGG 
TCTTCCATTT ACCTTGATGT TGTTGTTGGT ATCGTTAATG GAGAATCAAT GCTTAATGGT 
TCACCAATTA ATGATTTAAA TAAAATAACA AAACAATATA ATGAAACAGA TAAAATTGAT 
CATAACGCCA CTATAGATGA ACTTTTTGAG GAGCAACTAG AAGTTTCTGA TATCGTTTTA 
GTCTCTAGAT CAGATATCTT AAATGATGAT CAGTTTGAAG TTGTAAAACA TAAAATTCAA 
GGAAGTCTAA ACTCATCTAC TCCAGTCCTT AAATCCAATA ATGGCAAAAT TGATTTGAAC 
TATCTATTTG ATTTTAATTT TAAAAAAGAG ACTTATAAAG AGTTTTTAAC TGAAGAACAT 
GACCATAATC ATGTTGAACT TGTATCAGAT TCAATTAAAT TAAATTATTT CCTTGAAAAA 
AATGACTTTG AAAAGGAGAT GTCAAAAATT TTGGATGAAT TAAACATTCT TCGAATAAAA 
GGACGTATTT GGATACCAAA CAAATCATTA CCTTTACAAA TACAAATTGT TGGAAAGAAA 
ATTAATACTT GGTTTGAAGA AGCTCCAGAC AATTGTTGGA GACCAAATGA TAATGCTGGG 
CTTGAATTAG TAATAATTTC CTTTGATGAA AATTCTATAA AAACTTTCAA TAAAATAATT 
AAAGAGAAAT TTAAGATTTT AAGTGACCCA AAAATAGCAA TTTGA

Protein sequence

MKKKIPVIVV SGFLGSGKTT FLRYLLKESN KKFGLIINEF GDVGIDGDLI KSCDKCDESE 
DDCVIELNNG CLCCTVQDDF VPSIKALLEF NPPIESIIIE TSGLALPIPL IQALNWPEIR 
SSIYLDVVVG IVNGESMLNG SPINDLNKIT KQYNETDKID HNATIDELFE EQLEVSDIVL 
VSRSDILNDD QFEVVKHKIQ GSLNSSTPVL KSNNGKIDLN YLFDFNFKKE TYKEFLTEEH 
DHNHVELVSD SIKLNYFLEK NDFEKEMSKI LDELNILRIK GRIWIPNKSL PLQIQIVGKK 
INTWFEEAPD NCWRPNDNAG LELVIISFDE NSIKTFNKII KEKFKILSDP KIAI