Gene NATL1_19051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_19051
Symbol	lraI
ID	4779858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1567144
End bp	1568673
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	38%
IMG OID	640085195
Product	ABC transporter substrate-binding protein
Protein accession	YP_001015725
Protein GI	124026610
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAATT TTTCAAATCA GTCCAAAAAG GTTAAACCCA TAATCAATAA AACAGTTCTC 
AAAAGTTCTC TTGTTGCTGG AGCATTTTTA TTTTCTGGAA TCAATCAGAC AGCGCAAGCA 
AATACAAAAT CAATTGTTGC TGTAGAGCCA TTGGTTTGCG ATGTTGTATC TGCTATTGCA 
CCACCCTCTA CGCCCGTAAC CTGCTTAATT GACAGAAAGC AAGATGTTCA TGATATCAAG 
ATCACTCCAA GGCAAGCTCA AACACTAAAA AGTGCGAATC AAGTATTTAC TCTTGGTTCA 
GAGATGACCC CTGCAATTAA AAAATGGTTG GATAATCCCT TAACTGTTGT CGTTGGTGTA 
AGTGCAATAG AAATAGACGA TCATGACGAC CACGATGATC ATGACGATCA TTCAGCTGCT 
AAGCATGATG ATCATGACGA CCACGACGAT CATTCAGCTG CTAAGCATGA TGATCATGAC 
GATCACGATG ATCATGGCGA TGCCCATGGA GAGGGAGCTT TTGAATGGGC TGGTGTTTTT 
GATCTTTCCA CAGGAGTCTA CAAATGGTCT TTCGCCAAAG TTGATGGAGA CTATGCTGAT 
CCTGCGATGA AAATGGTTAT TCTTAAGTCT GGTGATATTG AAGCATCAGA AGAGCTTGCT 
AAAGAATTAT TAGGATCCAA AAATTCAGAA GTTAAGCGCA ATAATGACAA ACTTATTGCG 
CAGGACAAAG CCTTCCTTCT TACATTTAAT GAAAAGAAAG ACATCACAAC ATTTACTGTA 
GAAATCAAAA AATCTGGTAA ATACGCTTTC TTTACTGAGC ATATGCCGTT TGAGTTTGAA 
GCCGATGAAC ATTTCTTTAA AGATGTTTCA GGCGACGATG TTGAACCGAT TGCCCAAGTA 
CCAGATGAAG GAGATCATCA TCACCATGAC CATGGAGGCT TAGATCCTCA TATCTGGCAT 
GATCCACATA ACATCATCAA GATGGGAAAT GTAATTTCTA AAAATATCAA CAAGAAGATT 
TCATTTTTTG ATAGAGAGAC TAAAAAAGTT TTAAAAGAAA GAACTCAATC TGTAAATTCC 
ATTTTGGAAG ATCTAGATCA ATGGACTCAA GAACAAATAG CTACTATTCC TTCTGATCAA 
AGGACGATGG TTTCTAAGCA CAAAGCCATG GAATATTACG GAGATGCATT TGGATTGAAG 
ACCATGAGCC TACTAGATTT TCTTGGTGAT TCATCCAGCC TTAGGCCTCA AACTATTTCA 
ACTGTATTAG CTGAGCTTAA AGAAGAAAAC GTGAAAGTTT TATTCGCTGA GCAAAAGCCT 
CCTTCAAAGC TATTGAGGAA CCTCAGTAGA CAAACTTCCA CTCCTATCGC ATCAAATCAA 
ATCTATGTTG ACGGTCTAAT GCCAACAGGG AATACTGTTT CAGTTGCTGT ACATAACACC 
TGCACAATTG TTAATTCACT TGGTGGAGAA TGTGATGAGC AAGAGGGCGA TGAACTTGAG 
GGGAAATGGA ATTCTTTAAT TAATCCTTAA

Protein sequence

MLNFSNQSKK VKPIINKTVL KSSLVAGAFL FSGINQTAQA NTKSIVAVEP LVCDVVSAIA 
PPSTPVTCLI DRKQDVHDIK ITPRQAQTLK SANQVFTLGS EMTPAIKKWL DNPLTVVVGV 
SAIEIDDHDD HDDHDDHSAA KHDDHDDHDD HSAAKHDDHD DHDDHGDAHG EGAFEWAGVF 
DLSTGVYKWS FAKVDGDYAD PAMKMVILKS GDIEASEELA KELLGSKNSE VKRNNDKLIA 
QDKAFLLTFN EKKDITTFTV EIKKSGKYAF FTEHMPFEFE ADEHFFKDVS GDDVEPIAQV 
PDEGDHHHHD HGGLDPHIWH DPHNIIKMGN VISKNINKKI SFFDRETKKV LKERTQSVNS 
ILEDLDQWTQ EQIATIPSDQ RTMVSKHKAM EYYGDAFGLK TMSLLDFLGD SSSLRPQTIS 
TVLAELKEEN VKVLFAEQKP PSKLLRNLSR QTSTPIASNQ IYVDGLMPTG NTVSVAVHNT 
CTIVNSLGGE CDEQEGDELE GKWNSLINP