Gene NATL1_15821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_15821
Symbol
ID	4779166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1288627
End bp	1290075
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	29%
IMG OID	640084864
Product	hypothetical protein
Protein accession	YP_001015404
Protein GI	124026288
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.978409
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGAAT TTCAGCATAA GAAGAATAAT GAAAAGAAAG AAAAGGAATT CAAGACATTC 
TCTGTCCCAT TTGATATAGT TCAAAACAAT ATAAATATTA CTTTTCCCAA TCATAAATTT 
TCTACTTTAT CGGAAGAACA AATTATTAAT CAAGCAATAA AATTTCATTT AGATGGTAAC 
CTTTCTCAAG CTTCTATATG TTATAAACAT TGTATTAATA AGGGTGTTAA AGATCCCAGG 
GTTTTTTCTA ATTTTGCATG TATATTAAAA GGACTTCGTA AATTGAAAGA AGCAGAATTA 
TACTTGAAAA AAGCAATAGA GCTTAAACCT GATTTTGCCG ATGCTTTTTC TAATTTGGGT 
ATTGTCTCAA AGGGGCTTGG TAAATTAAAA GAAGCAGAAT TATATTTGAA AAAAGCAATA 
GAGCTTAAAC CTGATTTTCC TTCTGCATAT TATTCTTTAT CAAATCTTAA ATACTCTAAA 
GATGATCAGA AATGGCAGGA TAAATTGTTT TCTAAAAGTA TATTAAATAA TAAATCTAAA 
AAAGCTAAAA TTGAGATTTT TTTTGCAAGA TCTAATATTC TTCATCAAAA TAAAAAACAT 
AATGAAAGTT CTCTATACCT AGGACTTGCT AATCAAATTA AATTATCTAT TAAACCATCC 
AATGCTGATG GTTTAATTTG TAAATCTAAA GAATTACTTG TTGAGTTTAA TAGACAAAAA 
ACAAATACCA AACATCACCA GAGATCACAT CATAGTATTT TTATTGTAGG TATGCCAAGA 
AGTGGATCTA CACTAGTTGA GTCTATTCTT AGTATGAACC CTAATGTTGA TGATTTGGGT 
GAGATTAACA TTCTTGAGAA GTCTTTTTTG GAGAGTAAAA AGGTCGGTCA AAAATTAACT 
CTTGCTGAAA TATATTGGAA GGGAATAGAT AACTATAAGA AGACATCAAA TATAACAACA 
GATAAATGGT TAGATAACTA TCAATATGGA GGAATAGTTT TAAAGCAAAT ACCGAACTCC 
ATATTTATTC ACTGTTTTAG AAACCCTTTA GATAATATAC TATCTATATA TCGTGCACAT 
TTTTCTAAAC TTAATGAATA TGCTTCATCA CTGATTGATT GTACAAGAGT TTATATAAAT 
CAAGATGAAT TGATGACAGA ATATAAAAAA CACTTTAGAT CAAAAATATA TGACTTGGAT 
TATGATTTAT TAGTTAATGA TCCCAAAAAA GAAATCAAAT CATTGATCGC TTGGTTGGGA 
TGGAAATGGG ATGATTCATA TCTATCTCCT CATCTAAATA CACGCTCGAT TTCAACAGCA 
AGTAAGGTGC AAGTTCGGTC CCCAATTAAT TCAAAATCAT TGGGTGGATG GAAAAACTAC 
AGAGATATGC TTAAACCCGC TATTGAAGTC CTTGCTAAAA ATGATCGCTA TCTAGACTTG 
ATTTCTTAA

Protein sequence

MEEFQHKKNN EKKEKEFKTF SVPFDIVQNN INITFPNHKF STLSEEQIIN QAIKFHLDGN 
LSQASICYKH CINKGVKDPR VFSNFACILK GLRKLKEAEL YLKKAIELKP DFADAFSNLG 
IVSKGLGKLK EAELYLKKAI ELKPDFPSAY YSLSNLKYSK DDQKWQDKLF SKSILNNKSK 
KAKIEIFFAR SNILHQNKKH NESSLYLGLA NQIKLSIKPS NADGLICKSK ELLVEFNRQK 
TNTKHHQRSH HSIFIVGMPR SGSTLVESIL SMNPNVDDLG EINILEKSFL ESKKVGQKLT 
LAEIYWKGID NYKKTSNITT DKWLDNYQYG GIVLKQIPNS IFIHCFRNPL DNILSIYRAH 
FSKLNEYASS LIDCTRVYIN QDELMTEYKK HFRSKIYDLD YDLLVNDPKK EIKSLIAWLG 
WKWDDSYLSP HLNTRSISTA SKVQVRSPIN SKSLGGWKNY RDMLKPAIEV LAKNDRYLDL 
IS