Gene Tpen_1533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1533
Symbol
ID	4600375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	1480794
End bp	1482152
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	60%
IMG OID	639774307
Product	citrate transporter
Protein accession	YP_920932
Protein GI	119720437
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.232848
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCCT TGCGGGTGGC ATTCGTCTAC TCCGTGCACA TGAGAGAAAC GTTTTTCGCA 
ACGGGTTCTG AGTGTTGGAA GCGTATGTTC GACGCGAAGC CCCTGATAGG TGCCGGTGTA 
CTGGTGTACC TAACGGTAGC CCTCGTGGCG CGTAGCAGGA GGCCTAAGAC TCCTGTGTGG 
AGCATCATGG CGTTTGCCTC TTTCATAGTC GTAGCCACGG GGCTTCTCGG CATAGACGAC 
GTGAGGAAGA GCGTAGACGT AGACGTGATA CTATTCCTCG TGGGTATGTT CAGCATAGTA 
GGGCTCGCGG AGACGAGCGG GCTCCTCACT GCCGCCTCCT ACTTCTTCGT ATCCAGGTTT 
CACAGCAGGG TGAAGCTCTT CTACGCGTCG GCCGTTCTCT TCGGCCTGCT CGCCGCGTTC 
GCGGTAAACG ACACCGTTGC CCTCATGGGC CCCGCGGTGG CGTACGTGAT TTCGCGGGCG 
GCCGGCATAG ACCCCAAGGC GATGTTCCTC CTCCTGGCCT TTTCGATAAC GATAGGGTCG 
GCGATGACCC CCATAGGGAA CCCCCAGAAC GTGCTCATAG CCTCGGGCTC CGGGATGCCG 
GCCCCAATGC TGGTATTCAC GGCTAGGCTG GCGGTACCCA CGCTCGTCAA CCTGCTCCTA 
ACGGCCTACC TGCTCTCCAA GCTCTATGGG CTGAGGGACG CTAAGGTGCA GGTGGCGCTG 
ATCCCGGAGG AAGCCATAAG GAACAGGAGG GATGCCGCCC TGGCGGCCGC CGGCCTCGCC 
GGAACAGTTC TCGCGCTGGT GGTCAACGAC TTCCTCGAGC TCGCCGGGAT GCCGCACGTA 
TCGGACAGGG GCATTATACC GTTCGTCGCT GCCGCCGCTA TCTACCCGTT CACCTCCAAC 
CCGAGGAGGA TCCTCTCGAG GGTCGACTGG TCCACCGTAG TGTTCTTCAT AACCATGTTC 
ATAACGGTCG CGGGGGTTAT GAGGAGCGGG GTCGTCGACC CCGCACTACG GCTCTTGCTC 
CCCGAGAAGG CTACCGGAGC CCGGGATCTC TTCGCGATAG CCCTCCTCTC GCTGGCGCTG 
AGCCAGTTCC TGAGTAACGT GCCGCTGGCA AGCATAATGG TGGAGTACAT GAGGGGGCTA 
GGCTACTCGA GTACCGATGT CCGAGCCTGG CTAACGCTGG CAACAGCTTC AACCATCGCC 
GGCAACCTTA CCCTGCTGGG CGCGGCTTCG AATATCATCA TTCTCGAGAT GCTCGAAAGG 
CGCTTCAAGA CGACGATAAC ATTCACGGAG TTCCTCAGGG TAGGCGTGCT CGTAACTGCG 
CTGAACATGC TCGTATACGC GCCGTTCCTA CTCTTGTAG

Protein sequence

MLALRVAFVY SVHMRETFFA TGSECWKRMF DAKPLIGAGV LVYLTVALVA RSRRPKTPVW 
SIMAFASFIV VATGLLGIDD VRKSVDVDVI LFLVGMFSIV GLAETSGLLT AASYFFVSRF 
HSRVKLFYAS AVLFGLLAAF AVNDTVALMG PAVAYVISRA AGIDPKAMFL LLAFSITIGS 
AMTPIGNPQN VLIASGSGMP APMLVFTARL AVPTLVNLLL TAYLLSKLYG LRDAKVQVAL 
IPEEAIRNRR DAALAAAGLA GTVLALVVND FLELAGMPHV SDRGIIPFVA AAAIYPFTSN 
PRRILSRVDW STVVFFITMF ITVAGVMRSG VVDPALRLLL PEKATGARDL FAIALLSLAL 
SQFLSNVPLA SIMVEYMRGL GYSSTDVRAW LTLATASTIA GNLTLLGAAS NIIILEMLER 
RFKTTITFTE FLRVGVLVTA LNMLVYAPFL LL