Gene Nther_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_2067
Symbol
ID	6316051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	-
Start bp	2185199
End bp	2186626
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	39%
IMG OID	642644455
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001918222
Protein GI	188586677
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00121404
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0104805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGTTA CCAATAAAGG AATGAAGTGC CGCCAACTTC TGACAGGCGA AAGCTGCAAA 
GAAGGCTCAC CGCAGAAGAA TAGTGCGGAA CACGAAGGAT ATGCGGGAGT GCACAGTTCT 
TTAAGGATAA CTGAAAACAA CATCTCCAAT GCAAACTTGT CGAAGGGGAA TTTGCTAGAG 
GAAATTTTGG ATAGAGACAA CATGAATAAA GCATTCAAGA AAATAAAATC CAACAAAGGC 
TCTCACGGGA TTGATGGGAT GGGAGTAGAT GAACTTCTAC AATATCTCAA AGAAAACGGG 
GACCACCTCA GGCAAAGAGT CCTGGACGGT AAATACCGCC CTAATCCCGT CAGAAGGGTA 
GAGATACCTA AAGAAGATGG GAAGAAAAGA AAATTAGGCA TACCTACAGT GGTAGACAGG 
GTAATCCAAC AAGCAATAGC CCAAGTACTA TCTCCAATAT ATGAGGAGCA ATTCTCAGAT 
AACAGCTATG GTTTTCGCCC TGGACGCAGT ACTCATGATG CAATTAAGAA AAGTCAACAA 
AACATAAATG AAGGATACAA ATATGTAGTA GATATGGACT TGGAGAAATA CTTTGACACA 
GTAAACCAGA GCAAATTGAT AGAAGTGCTA TCTAAGACAA TAAAAGACGG TCGAGTAATA 
TCTCTTATCA ACAAATATCT AAGAGCAGGA GTAATGATCA AACACACCTA TAAGGATACA 
GAAGTTGGCG TGCCCCAGGG CGGGCCTCTT AGCCCTATCC TCAGTAACAT AATGCTCCAC 
GAATTGGATA AAGAACTTGA GAAAAGGGGG CACGAATTCG TCCGCTATGC GGACGACCTG 
CTAATCTTTT GTAAAAGCAG AAGAAGTGCC GGACGCACCT TGAAGAACAT ACTACCCTTC 
ATCGAAAATA AACTATTTCT CAAAGTAAAT AAAGATAAAA CTGTAGTTGC CTATGTAGGA 
AAGGTAAGAT TTCTTGGGTT TGGCTTTTAC AGACATAAAG GAAAAGCCAG ATTAAGAGTT 
CATCTTAAAT CAGTTACAAA GATGAGAACG AGAATAAAAG AACTCACATC TAGAAGTTAT 
GGAATAAGCA ACGAAGCCAG AGCAAAGAAA CTTAGCCGAT ACATTATGGG TTGGGTTAAC 
TACTTTAAAC CAGCTGATAT GAAGAATCTG TTAATAAATA CTGACAGTTG GATGAGAAGG 
CGTATTCGCA TGATTTACTG GAAACAATGG AAGAAAGTGA GAACAAAATT TAAAATGCTC 
AAGTTCTTTG GAGCCAATAA ATACAAAGCA TGGGAATATG CAAACACAAG AAAGGGCTAC 
TGGAGAATTT CCAATAGCCC CGTCTTATCC AAATCCCTTG GAAATGATGT AATCAAAGGA 
TTTGGTTTCC TATTCTTTTC GGAATATTAT CGACAAGTTA AAGCGTAA

Protein sequence

MTVTNKGMKC RQLLTGESCK EGSPQKNSAE HEGYAGVHSS LRITENNISN ANLSKGNLLE 
EILDRDNMNK AFKKIKSNKG SHGIDGMGVD ELLQYLKENG DHLRQRVLDG KYRPNPVRRV 
EIPKEDGKKR KLGIPTVVDR VIQQAIAQVL SPIYEEQFSD NSYGFRPGRS THDAIKKSQQ 
NINEGYKYVV DMDLEKYFDT VNQSKLIEVL SKTIKDGRVI SLINKYLRAG VMIKHTYKDT 
EVGVPQGGPL SPILSNIMLH ELDKELEKRG HEFVRYADDL LIFCKSRRSA GRTLKNILPF 
IENKLFLKVN KDKTVVAYVG KVRFLGFGFY RHKGKARLRV HLKSVTKMRT RIKELTSRSY 
GISNEARAKK LSRYIMGWVN YFKPADMKNL LINTDSWMRR RIRMIYWKQW KKVRTKFKML 
KFFGANKYKA WEYANTRKGY WRISNSPVLS KSLGNDVIKG FGFLFFSEYY RQVKA