Gene Nther_2078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2078
Symbol
ID	6316073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	2197651
End bp	2198850
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	39%
IMG OID	642644466
Product	transposase IS111A/IS1328/IS1533
Protein accession	YP_001918233
Protein GI	188586688
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.218145
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTTTG TTGGGATTGA TTGGGCTGAT ACAAAACATG ATATCCTGGT CATGAGTGGC 
GATGGTAGAG AACTAGATAA CTTCACTATT CAACATTCTC AAGATGGATT TGAAACTTTA 
GGAACTAAAC TTCTGAAACA TGACAACAAT CCTGAAAACT TCTGCTGCTT AATTGAAACC 
AAACATGGAC TTTTAACTCA ATATCTTTTA GAAAATAACT TCACTGTTTA TTCTGTTAAC 
CCCAAGCTAG TTGATGCTAG ACGAAAAGCT TCCGGGGCTA AAACTGACTT TATTGATGCT 
AAAATACTAG CTAATATGGG CAGATCAGAG CTCCATGACT TACATAAGCT AGAGCCTGAT 
TCGGAACATA TCCAAGAGCT TAAAGTACTC ACCAGAGATC AAGACGCCCT TATACAAGAA 
AGTACTAGGC TAACAAATAG GCTGATTTCA ACACTGAAAG AATACTATCC TGTAGCTCTT 
GAATTATTTT CTAAAATAAC TCTACCTATC TCTCTAGCTT TCTTAAGAAA ATATCCTACT 
CCAAAACAGG CTCGTAAAGC TAGCAGAGAT GATATCTACA AGTTTTTGAA AAAGCAAAAT 
CATCCTAACC CTTTATCTAA AGCTAATGAA ATATTCACAA AGCTTCAAAG ACGTAATTTA 
GAAGGTAACA GGGCTATTTG TTCTGCCAAG TCTAAGTTTT TATTTACTAT CCTTGATCAG 
CTAGAGCCTT TATTAGAGCA CATTAAAGAG TATGACAGGG AAATTGAAAA ACTTTTTAAG 
TCCCACTCTG ACAGTAAACT TTTTGAAAGC TTGCCAGGTG CCGGTAAGCG TATAGCACCG 
AGGCTGCTGG CAGAGTGGGG AGATGATAGA AGCCGTTATG CTGACGCCTC GGTAGTCCAG 
GCCCTTGCGG GAACTTCACC AGTACTACAT CAAAGTGGCA AAATGCGTAT TGTGAAAAGG 
CGGCATTCTT GTATTAAACC TTTTAGAAAC GCTTTGCATC AATTTGCTCT TCAAACTGCG 
AGGTGGGTCC CCTGGGCCAG AGATTATTAC CTCAGAAAGC GAAAAGAAGG CAAACAGCAT 
CATGAGGCTG CAAGGGCTCT AGCTAATATT TGGGTCAGGA TACTCTATGC TATGTGGCTG 
AACAAAGAAC CCTACAATGA AAACAAATTC TTAAAAGCTA GAGAAAAACA CGCTGCTTAA

Protein sequence

MYFVGIDWAD TKHDILVMSG DGRELDNFTI QHSQDGFETL GTKLLKHDNN PENFCCLIET 
KHGLLTQYLL ENNFTVYSVN PKLVDARRKA SGAKTDFIDA KILANMGRSE LHDLHKLEPD 
SEHIQELKVL TRDQDALIQE STRLTNRLIS TLKEYYPVAL ELFSKITLPI SLAFLRKYPT 
PKQARKASRD DIYKFLKKQN HPNPLSKANE IFTKLQRRNL EGNRAICSAK SKFLFTILDQ 
LEPLLEHIKE YDREIEKLFK SHSDSKLFES LPGAGKRIAP RLLAEWGDDR SRYADASVVQ 
ALAGTSPVLH QSGKMRIVKR RHSCIKPFRN ALHQFALQTA RWVPWARDYY LRKRKEGKQH 
HEAARALANI WVRILYAMWL NKEPYNENKF LKAREKHAA