Gene Tpen_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1823
Symbol
ID	4602060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	1765169
End bp	1766359
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	61%
IMG OID	639774596
Product	major facilitator transporter
Protein accession	YP_921221
Protein GI	119720726
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.262601
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGAGAGGA AGTTACTGTA CTCGATTACC TCACTGTACG TAGCGTACTT CCTGGTGTAC 
GTCCACAGGA CGATGACGGG AGTAGTCCAG GAGGAGCTTG GAGGGATAGC CAGCGCTCAC 
GGCCTCCCGC CGGCAGCCTT CACATCGATC GTTGCCGCCG CCTACTTCTA CACGTACGCG 
GCTATGCAAC TTCCAGCCGG AATTCTGGCG GACGCTCTCG GGGCGAAGAG GTACGTGGGA 
ACCAGCATGC TCCTGCTCGG CCTGGGATCA GCGTTAGCTT CAACGTGCGA CCCGACGCTG 
ATTCTAGTGG GTAGGCTCGT GATAGGGGTC GGCGCGGCTT CCGTGTGGGT TTCCCTCCAG 
CGCGTCATAG GCGTGTACGC CGAGAAAAAC GTCGGAGCAA CGCTCACAGG GCTTGCCCTC 
GCGGTGGGAA ACCTGGGAGC CCTTTTTGCC ACTGCGCCTC TCAGGGAGGC CGTAGACGCT 
GTGGGGCTCC GGGCGGTTTT CCTGTACCTC GCCGTCGCCG CCTTTATCTT AAGCGTCGCG 
GCTTTCCTGG GGATAAACGA CCCCGGGATA TCCCGCGGCT CCTTGAAGAG GGGGCTCGCG 
GAGACGCTCA GGCAGTTGAA GGTGGTCGCT AGATCCCGGC ATTCAATCGC TTTAGCGCTA 
GCCTTCGCGG GCACTTACTC GGCTGTGCTG GCGTTCCAGT CGCTCTGGGC GTCGATCTAC 
GTGTCTAGGT ACTTCCCGGA GTACAGGCGG GAAACCCCAC TCCTCCTACT GCTCCTGGCG 
CTAGCCTTCC TAGTATCCGT ACCCCTAGTC GGCTACGTCA GCGACGCCGT GCTGAAAAAG 
AGGAAGCCCG TCCTGCTCGC CGGGATAGTT CTACACTTCT TAGCGTGGGT CGGCCTACTG 
GTGGCTAGCA GGCTAAGCCT AGGTCTCGCG GAGCTCGAAG CCATTTTCCT GCTACTCGGC 
GTGGTGGCGG CAACCCACAT GGTGATACCT CCCCTCTCCC GCGAGGCGTA CAGCCCGGAG 
TTCTCGGGGA CGACGCTGGC GTTCGTAAAC ATGGTCGGCT TCGTGGCGAT AGCCGTTTAC 
CAGTCGATAG GAGCCGTCGT AGGAGACCCG AGCATACCGC TAGTGGTCTT CGCGCTCGTA 
TCGCTCGCGG CCCTACTCCT ATCCGGGAGC GTGAGGGAAA CTCTCAGCTA G

Protein sequence

MERKLLYSIT SLYVAYFLVY VHRTMTGVVQ EELGGIASAH GLPPAAFTSI VAAAYFYTYA 
AMQLPAGILA DALGAKRYVG TSMLLLGLGS ALASTCDPTL ILVGRLVIGV GAASVWVSLQ 
RVIGVYAEKN VGATLTGLAL AVGNLGALFA TAPLREAVDA VGLRAVFLYL AVAAFILSVA 
AFLGINDPGI SRGSLKRGLA ETLRQLKVVA RSRHSIALAL AFAGTYSAVL AFQSLWASIY 
VSRYFPEYRR ETPLLLLLLA LAFLVSVPLV GYVSDAVLKK RKPVLLAGIV LHFLAWVGLL 
VASRLSLGLA ELEAIFLLLG VVAATHMVIP PLSREAYSPE FSGTTLAFVN MVGFVAIAVY 
QSIGAVVGDP SIPLVVFALV SLAALLLSGS VRETLS