Gene A9601_11351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_11351
Symbol
ID	4717847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	955323
End bp	956672
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	38%
IMG OID	640078850
Product	cobalamin synthesis protein/P47K
Protein accession	YP_001009526
Protein GI	123968668
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTATTA AGGAAAAGGT TCCTGTAACC ATACTTACTG GATTCTTAGG ATCAGGGAAG 
ACTACTTTGC TTAATAGAAT ATTGAGTGAA GAGCACGGGA AAAGAATAGC AGTAATTGAA 
AATGAATACG GTGAAGTGGG TATAGATCAA GGGCTCGTAA TTAATGCAGA TGAAGAAGTG 
TTTGAGATGT CAAACGGGTG CATTTGTTGT ACTGTTCGCG GCGATTTAAT AAGAGTCCTT 
GGCAACCTTA TGAAAAGAAG AGATAAGTTT GACTATGTTT TAGTAGAAAC GACAGGATTA 
GCAGATCCAG GTCCAGTTGC TCAGACATTT TTCATGGATG AAGAGATTAG TTCTGAATTC 
ACTCTTGATG GAATTGTGAC TTTAGTTGAT GCTGCCCACA TTGATCAACA GTTAGGCAGG 
AGTGATGAAA GTTCAGAACA AGTGGCATTT GCAGATGTTC TTGTCCTTAA TAAAACTGAT 
TTAGTCTCTG ATGATGCACT AAATACTCTT GAATCGAGAT TGAGAGACAT GAACCGAATG 
ACCCGAATTA TTAGAGCCGA GAATGCCAAA GTACCAATTG AAACAGTCTT AAATCTAAGT 
GCATTTGATC TTGATCAGAT CCTTAAACGC AGGCCAACAT TCCTTGAACC AGAATATCCT 
TTTGAATGGA CAGGTGTTTA CGATCTTGAT GCAGGTAAAT ATGAATTAAT GCTAGAAGAA 
GGACCCGATC CAGAAATGTC CTTAGTAGCC CTCGCTAACC AAGGAGAGAG TGAAGAGGAA 
CTTAAAGATG GTGCTGAATC CTCCGTGAGA CTTTATGCAG AAAAAGCTAA TAGTTTAGAT 
CCTGGAAATA CCATCCCATA TGGAGAACAT ATAAATCTCA AATTGGAGGA TAAAGGAAAT 
AAATCATTCA TCCTGAACAT AGAAAAACCA ACAAAAATAG GTTTGTTTAC ACAGCACACT 
GCTGAAGAAT TCAATATGAA AGTCATTAAA AGTGACGAAA ATAAAGAGAT TCCATTTAAT 
ACTGAAAGAT TCTGGCAAGC AGAGCACGAA CATGATGATG AAGTAGGCTC AATTGCTATA 
GAGCGTTTTG GAGATGTTGA CCCAGAAAAA CTAAATACTT GGATGGGAAG ACTTCTATCA 
GAAAAAGGAG TGGATATATT CAGAACTAAA GGTTTCATAA GTTACTCAGG TAACCCAAGG 
AGAATAGTTT TCCAGGGAGT TCACATGTTA TTTACTGCAC AACCTGATAA AGAATGGGGT 
AACGAACCTC GTAGAAATCA ACTTGTTTTT ATCGGTAGAA ATTTAAATGA GAAAGAGATG 
CAAGAAGGCT TTGATAAATG CCTGAAATAG

Protein sequence

MSIKEKVPVT ILTGFLGSGK TTLLNRILSE EHGKRIAVIE NEYGEVGIDQ GLVINADEEV 
FEMSNGCICC TVRGDLIRVL GNLMKRRDKF DYVLVETTGL ADPGPVAQTF FMDEEISSEF 
TLDGIVTLVD AAHIDQQLGR SDESSEQVAF ADVLVLNKTD LVSDDALNTL ESRLRDMNRM 
TRIIRAENAK VPIETVLNLS AFDLDQILKR RPTFLEPEYP FEWTGVYDLD AGKYELMLEE 
GPDPEMSLVA LANQGESEEE LKDGAESSVR LYAEKANSLD PGNTIPYGEH INLKLEDKGN 
KSFILNIEKP TKIGLFTQHT AEEFNMKVIK SDENKEIPFN TERFWQAEHE HDDEVGSIAI 
ERFGDVDPEK LNTWMGRLLS EKGVDIFRTK GFISYSGNPR RIVFQGVHML FTAQPDKEWG 
NEPRRNQLVF IGRNLNEKEM QEGFDKCLK