Gene NATL1_19071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_19071
Symbol
ID	4779852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1569055
End bp	1570437
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	42%
IMG OID	640085197
Product	cobalamin synthesis protein/P47K
Protein accession	YP_001015727
Protein GI	124026612
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA CGCTAAAAGT ACCGGTTACA ATATTGACTG GTTTTCTAGG ATCTGGCAAA 
ACAACCCTAC TCAATCGAAT CCTGAGCGAA GAGCACGGTA AAAAAATAGC TGTTATTGAG 
AATGAATATG GTGAAGTTGG CATTGATCAA GGATTAGTCA TTAATGCTGA TGAAGAGGTC 
TTCGAGATGT CCAATGGTTG CATTTGCTGC ACCGTTCGGG GTGATCTTAT TCGTGTACTT 
GGAAACCTCA TGAAGAGGCG AGACAAATTT GACTATGTAT TAGTTGAAAC TACTGGCCTT 
GCTGATCCTG GTCCTGTCGC TCAGACATTC TTTATGGACG ATGAAATCCG TGAGGAGTTT 
TCACTTGATG GAATAGTCAC ACTTGTTGAT GCAGCCCATA TAGAGCAACA ACTTGGTCGA 
AGTGATGAGA GTTCGGAGCA AGTTGCCTTT GCTGACGTCC TTGTCCTAAA TAAAACCGAT 
CTAGTTTCAG ATGAATCACT CGACAACTTA GAATCACGGC TACGCGATAT GAATCGTATG 
GCTCGTGTCA TACGTAGTAA ACAAGCAGAC GTCTCAATTG ATACTGTGCT AAATCTAAGT 
GCTTTTGATC TAGATCAAGT ACTTAAGCGT CGTCCAACTT TTCTTGAACC AGAATACCCA 
TTTGAGTGGA CAGGTGTTTT TTCACTTGAA AAAGGTCGCT ATGAACTTAC GCTCGAAGAA 
GGTCCAGACC CCACAATGTC TCTCGTCCAG TTATTAGACC AAGGTAAAGA CGAGACAGCT 
CTTAACACAG GTGCTGAATC ATGCGTGAGA CTCTACGCAG AACAAGAACA ACTTATGAAT 
CCAGGGGATT TGGTTCCAGT CGGCAAGCAT GTGAGCCTTC AACTTCAATC CGAAGGGACT 
AAGTCCTTCT TCATAGATGT TGATAAGGCA AGGGATATAG GTCTATTCAC GCAACATACA 
GCCGAAGAAT TTAATATGAA ATTAACGAAA GTAAATACTC CTTCTACAGA CGAGATAGAT 
AATGATCATA ACATCTCTAC AATTTCTCCA ATAGCTGAGA GGGTTTGGGT AGCTGAACAC 
GAACACGATG ACGAAGTAGG TTCATTCGCT ATCGAGCGAG AGGGTGATGT AGATCCGGAG 
AAACTCAATA GATGGCTAAG TCGACTTTTG TCTGAGAAAG GTGTGGATAT ATTTCGCACT 
AAAGGTTTCA TTAGTTATGC GGGTGAATCT AAGCGAATAG TTTTTCAAGG AGTACACATG 
CTCTTCACAG CACAACCTGA TAAAGAATGG GGCAATGAAC CTCGCCGTAA CCAACTCGTC 
TTTATCGGTA GAAATCTTGA TGAAGCAGAA ATGATCAAGG AGTTTGATAA ATGCCTGGTA 
TAG

Protein sequence

MSNTLKVPVT ILTGFLGSGK TTLLNRILSE EHGKKIAVIE NEYGEVGIDQ GLVINADEEV 
FEMSNGCICC TVRGDLIRVL GNLMKRRDKF DYVLVETTGL ADPGPVAQTF FMDDEIREEF 
SLDGIVTLVD AAHIEQQLGR SDESSEQVAF ADVLVLNKTD LVSDESLDNL ESRLRDMNRM 
ARVIRSKQAD VSIDTVLNLS AFDLDQVLKR RPTFLEPEYP FEWTGVFSLE KGRYELTLEE 
GPDPTMSLVQ LLDQGKDETA LNTGAESCVR LYAEQEQLMN PGDLVPVGKH VSLQLQSEGT 
KSFFIDVDKA RDIGLFTQHT AEEFNMKLTK VNTPSTDEID NDHNISTISP IAERVWVAEH 
EHDDEVGSFA IEREGDVDPE KLNRWLSRLL SEKGVDIFRT KGFISYAGES KRIVFQGVHM 
LFTAQPDKEW GNEPRRNQLV FIGRNLDEAE MIKEFDKCLV