Gene NATL1_18981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_18981
Symbol
ID	4779915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1562002
End bp	1563174
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	41%
IMG OID	640085188
Product	hypothetical protein
Protein accession	YP_001015718
Protein GI	124026603
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTCT TTGCTCAATT AATCTCAATC CCTGCTGTCT TAGGTTTCAT GACTCCAATT 
GCTGTTCAAG CAGGAGGTGA AAAGCACATA GGTCATCATG ATCACCATGG TAGTCATATG 
AATATGGGAG ATTCATACCC CTCAACTATG TTTATGGGTA AAACGACTTT TGTTTTGGGT 
GGAGTAGATG GCGTGAGCGA TTCTGGAATG GGTGGAATGT CTACTTCTGA CGAAAAGGAT 
GGAACAGTTT TTCATTACGA TACGAAGTTA ATGTTTATGA CCAGTTTCAC TGGGCAAGAC 
ATGCTTAAAA CTGCTGTTCG AGTAGGTAAT TTTGGCATGA TGGAACCCTT TGGAATGATG 
GGTGAGGCAA GATTAGATAC TGCTTTCAGT AGTAATGATT CGTTAGAACT TCATAAGGCT 
TTTTATCAGT TTCCTGTTGG AGATGATATT CATGTAACTT TTGGGCCCAA GCTCCGCCAA 
GATGATTTAC TTGGAGTGTG GCCTAGTACT TACCCAGGCG ATGGAGTCTT GTTTGTCTTG 
AATCAGGCAG GCGCCAATGA TACTTATTCC AAGAAGATGG GCGCGGGTGC TGGAATTACT 
TGGTCCCATG ACAAATTAGT TGCTTCTGCA CTTTTCGTTT CAGAAGACGC ATCAAATTCT 
TCGATTGGCT TTTTAGCTGA TGAAGGCAAA GACCACACAA CCGCTCAATT GGCATGGGTT 
GACGAGAAAT ATACTTTATC AGCTGCGTAT ACACAGGCTG ATAACGGGAA TACTGATAAT 
TCTCCTGATA TTAACGACTA CTCCTCTTTT GGGATTAGTG GTAGCTATCA ATTTGGAGAC 
GACTACAGCT TGAGTGCAGG AATGGGATGG AAAAATCCTG ATAACGATGA TAGTCCTGAT 
ACTTCTATGA ATAAAGTTGA AGATGGAAAT ACATGGTCTA TTGGATTCCT ATGGAATAAT 
GCGTTGATTG AAGGTAATAA GTTTGGTTTT GGTATTGGAA CAGCCGAAAC TCATAGGGAT 
GACAGTGGTT ATGACGACCC TTTAGCTTGG GAAGCTTTTT ACGATTTTAA AGTGAATGAT 
AGTGTCACAG TCACCCCAGC TATCTTTGTT ATCGAGAAAG ATGGTCAAGA GGACGTTAAT 
GGAGCCTTGG TGAAAACTAC TTTTAATTTC TAG

Protein sequence

MRLFAQLISI PAVLGFMTPI AVQAGGEKHI GHHDHHGSHM NMGDSYPSTM FMGKTTFVLG 
GVDGVSDSGM GGMSTSDEKD GTVFHYDTKL MFMTSFTGQD MLKTAVRVGN FGMMEPFGMM 
GEARLDTAFS SNDSLELHKA FYQFPVGDDI HVTFGPKLRQ DDLLGVWPST YPGDGVLFVL 
NQAGANDTYS KKMGAGAGIT WSHDKLVASA LFVSEDASNS SIGFLADEGK DHTTAQLAWV 
DEKYTLSAAY TQADNGNTDN SPDINDYSSF GISGSYQFGD DYSLSAGMGW KNPDNDDSPD 
TSMNKVEDGN TWSIGFLWNN ALIEGNKFGF GIGTAETHRD DSGYDDPLAW EAFYDFKVND 
SVTVTPAIFV IEKDGQEDVN GALVKTTFNF