Gene NATL1_20161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20161
Symbol
ID	4779553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1659082
End bp	1660233
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	43%
IMG OID	640085308
Product	hypothetical protein
Protein accession	YP_001015836
Protein GI	124026721
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2109] ATP:corrinoid adenosyltransferase
TIGRFAM ID	[TIGR00708] cob(I)alamin adenosyltransferase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.137745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTTCAA ACGGTATAGG GATTACGACA GCATCGGAAA GCTTGGAACG TAGTCAAGGA 
CAATTACATG TTTATGACGG AGAGGGTAAA GGGAAGAGCC AGGCAGCCTT GGGGGTCGTT 
CTGAGGACCA TAGGTCTAGG CATATGTGAG AAAAGACAAA CAAGGGTATT ACTTCTTAGA 
TTCTTGAAAG GACCTGGTCG CTCGTATGAC GAAGATGCCG CAATAGATGC TTTGCAGCAA 
GGCTTCCCTC ACTTGATTGA TCAAGTGAGG ACTGGCAGGG GAGAATTTTT TAGCGCCGAT 
CAATCTACCA AATTTGATTA TCAGGAAGCT CAAAGAGGTT GGGACATAGC CAAGGGGGCA 
ATCGCTAGTG CCTTGTATTC AGTTGTTGTC CTCGACGAAT TGAATCCTGT TCTGGATTTA 
GGATTATTGC CTGTTGAAGA AGTTGTTAAA ACACTTAAGT CAAGACCAAA CGGTATGGAA 
ATTATCGTTA CTGGAAGAGC TGCACCAAAT CCTCTGATTA AAGTTGCGGA ACTGCATTCT 
GAGATGAGAG CTCACAGACG ACCTGAGATT AGTAACGATG AAATTCTTTT TGAAAATAAT 
GTTGGTGGGA TTGAAATATA TACGGGTGAA GGAAAAGGCA AATCAACCAG TGCGTTGGGT 
AAAGCTTTAC AAGCTATCGG TAGAGGAATA AGTCAGGACA AAAGTCATCG TGTTTTGATT 
TTGCAATGGC TGAAGGGTGG TAGTGGTTAC ACAGAGGATG CCGCTATTGC GGCTCTTCGA 
GAAAGTTATC CTCATTTAGT AGACCATCTT CGATCTGGTA GAGATGCGAT TGTTTGGAGG 
GGCCAGCAAA AGCCCATTGA CTATGTAGAG GCTGAAAGAG CATGGGAAAT TGCAAGGGCA 
GCTATTTCAA GTGGTCTTTA TAAGACTGTG ATTTTGGATG AGTTAAATCC AACCGTTGAT 
TTGGAACTCC TCCCAGTTGA GCCTATTGTT CAAACATTGC TTCGTAAACC TTCCGAAACC 
GAGGTGATTA TTACAGGAAG ATGCAAAAAC CAACCTATAT ATTTTGATTT AGCAAGTGTT 
CATTCTGAGA TGGTGTGTCA CAAGCACTAT GCTGAAAAAG GAGTTGATTT AAAAAGGGGA 
GTTGATTATT AG

Protein sequence

MVSNGIGITT ASESLERSQG QLHVYDGEGK GKSQAALGVV LRTIGLGICE KRQTRVLLLR 
FLKGPGRSYD EDAAIDALQQ GFPHLIDQVR TGRGEFFSAD QSTKFDYQEA QRGWDIAKGA 
IASALYSVVV LDELNPVLDL GLLPVEEVVK TLKSRPNGME IIVTGRAAPN PLIKVAELHS 
EMRAHRRPEI SNDEILFENN VGGIEIYTGE GKGKSTSALG KALQAIGRGI SQDKSHRVLI 
LQWLKGGSGY TEDAAIAALR ESYPHLVDHL RSGRDAIVWR GQQKPIDYVE AERAWEIARA 
AISSGLYKTV ILDELNPTVD LELLPVEPIV QTLLRKPSET EVIITGRCKN QPIYFDLASV 
HSEMVCHKHY AEKGVDLKRG VDY