Gene NATL1_06601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_06601
Symbol
ID	4779897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	605990
End bp	607168
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	36%
IMG OID	640083938
Product	hypothetical protein
Protein accession	YP_001014487
Protein GI	124025371
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACC TAGCTTCTGA ACAGAAATGG AGTTGGTGGC CACTTTTACC ACTCTATCCT 
TATGGTAGAA AAAGAACAAT ATTCAGGGAA TTAGTTCCAA ATCAGATTTG GAGTTTTGAA 
CAACTTCAGG GGATTTATTA TGTTGCTGTC CCTGTGAGGT TATTAGTTGT AAGAGTAAAG 
AATGGATTGA TGATAATTAA CCCTCTCCCC CCGACGGAAG AATTGCTGAG TGACATCAAC 
GTACTTGTAA AAAAAATTGG TCCTGTAAAA ACTATTGTTT TACCTACGGC TTCTGGCTTA 
GAACACAAAA TCGGACTTCC TGCTTTGGCT AGAGCTTTTC CTAATGCAAA AATATGGTTA 
TGTCCTGGGC AATGGAGTTT TCCTCTTCAA TTGCCTTTTG ATTGGCTAGG AATTCCATCT 
AATAGAACAA ATATTTTATT GGCTGATGGA TTTCCACATG GTGATGATTG TGAATGGATT 
TCTTTAGGAC CTATTGATAT TGGTCTAGCA CGTTTTCAAG AGATTTCTTG TTTTCACAAA 
CCAACAAAAT CTTTATTGGT AACTGATGCT CTGGTGGGTA TCGAGGACAC CCCTCCTGAG 
ATCTTTAATT TAGATCCAAC TCCGTTGTTG TTTCATTCTA GAGAGAAAGG CTCCGAGGAA 
CTTATTGATT CACCTATTGC TAGAAGGAGA GGATGGCTTC GATTAGTTCT TTTCGCTTCT 
TACCTTAAAC CTGAAAAGTT GGAGATACCA AAAATAAAAG AGATTCTTGA AAACTCTTTT 
AAGCCAAAGA TGAGAAACAA AAGATCACAT TTTGGAATCT ATCCTTTTGC TTGGCAGAAG 
GGTTGGGAGC TGTCTGCGAA AAAACTTGTT GGAGAAAAGA CTCCCCTAAT ACAAATTGCT 
CCAGTAATAG AAAGATTAGT GTTCCCTAGA GGAAAAAAAG CTTTTATCGC TTGGTTGAAT 
AAAGTTGAGT CTTTAAAAGG GATTTCTTTT CTGATTTCTT CTCATTACAG TGGAAAAGTG 
AGATTCACTA CAAATGAAAT AAGAGCTTTA AAAGTTAAAA TTGATAATTC AAATTGGGAA 
AAAACCCAAG GAGATTTTAA GTTTTTAAGT TGGTTCGATC AAAAATTATT AGATATTGGA 
ATAGTTCCTA AAAATCCACT AAAAAAATTC AGCGATTAA

Protein sequence

MSNLASEQKW SWWPLLPLYP YGRKRTIFRE LVPNQIWSFE QLQGIYYVAV PVRLLVVRVK 
NGLMIINPLP PTEELLSDIN VLVKKIGPVK TIVLPTASGL EHKIGLPALA RAFPNAKIWL 
CPGQWSFPLQ LPFDWLGIPS NRTNILLADG FPHGDDCEWI SLGPIDIGLA RFQEISCFHK 
PTKSLLVTDA LVGIEDTPPE IFNLDPTPLL FHSREKGSEE LIDSPIARRR GWLRLVLFAS 
YLKPEKLEIP KIKEILENSF KPKMRNKRSH FGIYPFAWQK GWELSAKKLV GEKTPLIQIA 
PVIERLVFPR GKKAFIAWLN KVESLKGISF LISSHYSGKV RFTTNEIRAL KVKIDNSNWE 
KTQGDFKFLS WFDQKLLDIG IVPKNPLKKF SD