Gene Nther_0169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_0169
Symbol
ID	6316551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	193231
End bp	194430
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	38%
IMG OID	642642547
Product	transposase IS111A/IS1328/IS1533
Protein accession	YP_001916356
Protein GI	188584811
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00419214
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTTTG TTGGGATTGA TTGGGCTGAT ACAAAACATG ATATCCTGGT CATGAGTGGC 
GATGGTAGAG AACTAGATAA CTTCACTATT CAACATTCTA AAGATGGTTT TGAAACTCTA 
AAAAACAAGC TATTAAAACA TGATGACGAT CCTGAAAACT TCTATTGCTT AATTGAAACT 
AAACATGGAC TTTTAACCCA ATATCTTTTA GAAAATAACT TCACTGTTTA TTCTGTTAAC 
CCCAAACTAG TTGATGCTAG AAGAAAAGCT TCTGGGGCTA AAACTGACTT TATTGATGCT 
AAAATACTAG CTAATATGGG TAGATCAGAG CTCCATGACT TACATAAGCT AGAGCCTGAT 
TCTGAACACA TCCAAGAACT TAAAGTACTC ACCAGAGATC AAGAAGCTCT TATACAAGAA 
AGTGCTAGGT TAACAAATAG ACTGATTTCA ACCCTGAAAG AATATTACCC TGTTGCTCTT 
GAATTGTTTT CTAAAATAAC TCTACCTGTT TCTCTAGCTT TTTTAAGGAA ATATCCTACT 
CCAAAACAGG CTCGAAAAGC TAGTAGAGAT GAGATCTTTA AGTTTTTAAA AAAGCAAAAA 
CATCCTAACC CTACGTCTAA AGCTAATGAG ATCTTCACAA AGCTTCAAAA ACCTAATTTA 
GAAGGAAACA GAGCCATTTG TTCTGCCAAG TCTAAGTTTT TATTTACTAT CCTAGATCAG 
CTAGAGCCTT TATTAGAACA TATTGATGAG TACGACAAGG AAATCGAGAA ACTTTTTAAG 
TCCCACTCTG ACAGTAAAAT TTTCGACAGC ATACCAGGTG CCGGTAAGCG AATTGCACCG 
AGGCTGCTGG CAGAGTGGGG AGACGATCGC AGCCGTTATG CTGACGCCTC GGTGGTACAG 
GCCCTTGCGG GAACTTCACC AGTACTCCAT CAAAGTGGCA AAATGCGTAT TGTAAAAAGG 
CGACACTCTT GTATTAAGCC TTTTCGAAAC GCTTTACATC AGTTCGCTCT ACAAACTACA 
AGGTGGATCC CCTGGGCCAA AGACTATTAC TACAAAAAGC GCAAAGAAGG TAAACAGCAT 
CATGAAGCTG TAAGGACTCT AGCTAATATT TGGGTTAGGA TACTCTTTGC TATGTGGGTA 
AACAAAGAGC CCTACAACGA AAGCAAGTTC ATAAAAGCTA GAGAAAAACA CGCTGCTTAA

Protein sequence

MYFVGIDWAD TKHDILVMSG DGRELDNFTI QHSKDGFETL KNKLLKHDDD PENFYCLIET 
KHGLLTQYLL ENNFTVYSVN PKLVDARRKA SGAKTDFIDA KILANMGRSE LHDLHKLEPD 
SEHIQELKVL TRDQEALIQE SARLTNRLIS TLKEYYPVAL ELFSKITLPV SLAFLRKYPT 
PKQARKASRD EIFKFLKKQK HPNPTSKANE IFTKLQKPNL EGNRAICSAK SKFLFTILDQ 
LEPLLEHIDE YDKEIEKLFK SHSDSKIFDS IPGAGKRIAP RLLAEWGDDR SRYADASVVQ 
ALAGTSPVLH QSGKMRIVKR RHSCIKPFRN ALHQFALQTT RWIPWAKDYY YKKRKEGKQH 
HEAVRTLANI WVRILFAMWV NKEPYNESKF IKAREKHAA