Gene Nther_2388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2388
Symbol
ID	6314275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	2551271
End bp	2553022
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	44%
IMG OID	642644776
Product	extracellular solute-binding protein family 5
Protein accession	YP_001918541
Protein GI	188586996
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAGGTT ATTGGTGGAC CTTTGTGACT GTGTTAGTCT TAAGTTTTAC CTTAGTGTTT 
ACTGGCTGTG GCCCCGATGA TGCCGATCCT GCCGAAGAAG AACCAGAAGA AGCTCCTGAC 
CCCGACAGAA AAGTTGAAGA AATTGTAATC AACACTACCA CTATGGATTA CGACCCGGCT 
AGAAATGAAG TCGCCAGGTG GGTAGGAGAT ACTTTTGAAA CTGAACTAGG CGTTGATGTG 
GAAGTTCAAC CTAGAGAGTT TACAACTTTA GTAGACTCAG CTCGTCGGGA TCCTGGTGAA 
TCTGAATGGC AAGCCATCAC TCTAGGTTGG TCTGGGCGGA TAGAGAGAGC CGACCCTGAC 
ATGTTCACTC ACACCTTGTT CCATTCCGAT CAAGCTTACG ACGGTGGAAA CAACTATCAT 
AATTATGAAA GTGATGAATA TGACGAGCTA GCAGAACAGG CCAGGATGGC CTTCGATGAA 
GATGAAAGAC AGGAACTGGT CTATGAAATG CAAGAAAAAT TAGCTGAAGA TATTCCCATG 
ATTGTATTGT ACAACGAGGC TGAACATCAA GCTCAAAACG TGGAACGCTG GGACAATGTA 
ATACAAACTC CTGAAGGAAA ATACAGTGAA TGGTTCCCCT ATTACGCTGA ACCATTAACT 
GATGATGATC ATTTTAGAAT CGGCTATACC CAGGATTTGG ATACATTTAA CCCACTAGCA 
GCTACCACAG TTTTTGAGTG GAAATTACTA CGACTAAATT ACGACAAATT GTTCCGAGTT 
GGCCCTGATA TGGAATTGAG GCCCTGGATG GCTGAAGATC ACGAGGTCGT AGACGAACAA 
ACCATAGATG TGGAACTTCG GGACGGTTTA GAGTTTCATG ACGGTGAACC TGTTACACCA 
AGAGACGTTA AATTTACCTT TGATTACATG ACAGACTGGG GAGTAGGTTA TTTTGCCGGT 
TTCTTAGATC CTCTAGACGA AGTGGAACTA CTTGAAGACG AAACAATTCG CTTCCACTTG 
GAAGAACCCA ATGCAACCTT CTTGACAAAT ACTTTAACCC AAATTGTCAT CTTACCAAAA 
CACATTTGGG GAGACTTAGT TGAACCAGAA GAGGATCATG TTTGGGGAGA AATGATGGAT 
GATCCCAGTC AAAGCGAAGG ATTATCCCAC CCCGATGAAT ATGAAAATGA AGAAGCCATC 
GGAAGTGGAC CTTATGAACT GGACTACTGG AACCGAGGTG AAGAAATCAG CCTTGTTCGC 
AATGAAAATT ACTTTGACCA TCCCGATTAC TATGATGCCG ATGAAATAGA TGTAGAAAGG 
ATTTCCTATA TAATTTACGG ACACGAAGAA GGTGTTATGG GCGGCCTTGA ACACGAAGAA 
ATTGACCTGG TAGGAGATGC TTACATGTCC GATTACGTGG ATAGAGTTGA AGAAATGGAG 
CATGTGGAAT ATTCCGGACA CACATCCATC GGTTTCCACT ATTTATCCTT CGATCTCAGC 
GAACCACCTT TTGAAGACCA CGCCTTTAGA GAAGCAGCTG CCCACTTAAT AGATGCCGAA 
GAACTACTGG ATATTGTCCA CGGAGGTTAC GGAGAACCCG GTGGTGCAGG TAGAGTAATT 
TCACCATCAG TCGAGTTTTG GAGAAATCCC GATGTGCCAG AATACCCCTT TGACCCAGAC 
CGAGCAGTAG AAATTTTAGA AGACGCAGGT TATGAATTTT ACGATGGAGA TCTCTATTAT 
CCCGAAGACT AA

Protein sequence

MKGYWWTFVT VLVLSFTLVF TGCGPDDADP AEEEPEEAPD PDRKVEEIVI NTTTMDYDPA 
RNEVARWVGD TFETELGVDV EVQPREFTTL VDSARRDPGE SEWQAITLGW SGRIERADPD 
MFTHTLFHSD QAYDGGNNYH NYESDEYDEL AEQARMAFDE DERQELVYEM QEKLAEDIPM 
IVLYNEAEHQ AQNVERWDNV IQTPEGKYSE WFPYYAEPLT DDDHFRIGYT QDLDTFNPLA 
ATTVFEWKLL RLNYDKLFRV GPDMELRPWM AEDHEVVDEQ TIDVELRDGL EFHDGEPVTP 
RDVKFTFDYM TDWGVGYFAG FLDPLDEVEL LEDETIRFHL EEPNATFLTN TLTQIVILPK 
HIWGDLVEPE EDHVWGEMMD DPSQSEGLSH PDEYENEEAI GSGPYELDYW NRGEEISLVR 
NENYFDHPDY YDADEIDVER ISYIIYGHEE GVMGGLEHEE IDLVGDAYMS DYVDRVEEME 
HVEYSGHTSI GFHYLSFDLS EPPFEDHAFR EAAAHLIDAE ELLDIVHGGY GEPGGAGRVI 
SPSVEFWRNP DVPEYPFDPD RAVEILEDAG YEFYDGDLYY PED