Gene Tpen_1203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1203
Symbol
ID	4600405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	1141701
End bp	1143098
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	61%
IMG OID	639773979
Product	citrate transporter
Protein accession	YP_920604
Protein GI	119720109
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1055] Na+/H+ antiporter NhaD and related arsenite permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCGTGG AGCGCGCGGC CTCCCAGCAG TACGCCTTCA GGGTTCTCCT AGTGCTGGTA 
GCCGGTCTGG TCACCGCTCT CGCGTCCTCG CTCCTCGGGT TGGAGGCCCA GCAAGTGCTC 
GCCCTGACAG CCTTCCTGAT GACGATATAC GCGACCCTGC TACTCTGGAC CTACAGGCTC 
CCCTTCGCGT TCCTGGGGGT CTCCGCCCTC TTCCTGCTCG GCGTGCTCGA TGTAGAGTAC 
TTTGTCGAGC ACTCGCACCT GGACGTGATA GCCTTCCTGA TAGCGATGAT GACTATCGTG 
GGCTACCTGG AGGAGGACAG GTTCTTCGAG TTCATCGCCC AGGAGATCGT GAGGAGGGTC 
GGTGTAAACT TCAGGGCAAC GTTCCTGGTG GTAGTCTTCC TGTCCGGCTT CCTGGCCCCG 
CTGGTCGACG AGGTTACCTC GATACTCGTT ATGCTGTCCG TAGTGCTCCC GCTGAGCGGA 
AAGATAGGCG TCGACCCCCT ACCGCTAGTC ATTGCCTCCA TCTTCGCGAC GAACATAGGT 
AGCGCTATGA CCCCGCTCGG GAACCCTGTG GGCGTTCTCG TGGCGTTCGA GTCCGGGCTG 
ACCTTCTCGG ACTTCCTGGC GCGGGCCGCG CCCGTCTCCG CGCTGTCCCT GGTGGTAGCG 
GCGGCTATAC TCATGCATTT GTTTAGGGGG TACATCGAGG AGGGAAACGC CCTCGCCTCG 
CAGAGGTTTA CCGATGGGTG GAGCGTGGCA TCCCTGGAAA GGAGAACCCT CTACAGGGAC 
GCGTCCGTGT TCTCCGCTAC GATACTCTTC ATAGCCGCGC ACCACGTTTT AGAGGAGGCT 
CTCGGCTTGC CGAAGAACTC CCTCCTCCTA GCAGCCCCAC TGATGGTGGC TGGGCTCATA 
ATGTTGCTAG ACCCTTCGAG GGGGTTTCAC GCGCTGGAAA CTAAGGTGGA GTGGCCTACC 
CTCGTATTCT TCTTGTTGCT CTTCGCATCG GTCGGAGCCT TGGAGAAAAC GGGCGTCGTA 
GAGGTTCTGT CGAAGAGTCT AGGCTCTCTG TCCGCGTCGG GGGTAGGCGC CTTCATGGGA 
GCGTTCACGC TTTCTTCCTC CCTTATGAGC GCCTTCATGG ACAACGTGAT CGCCGTCGCG 
ATTCTATCCC GGGTTGTACA CGAGCTAGGC GCCCAGGGGT TCCACACAGA GCCGTTCTGG 
TGGCTGACGC TATTCTCGGC CGTCTACGCC GGGAACCTTT CACCGATAGG TAGCACTGCG 
AACATAGTGG CGCTCAGCGT CCTGGAGAAA AGGCTGGGCA GGTCCGCCGG GTTCAAGGAG 
TGGCTGAGAG TCGGGCTACC GGTTACGGCG GCAACCCTCG CCCTGGGCTT CGCGGCTGTC 
TACCTCCAGA TCCCGTAG

Protein sequence

MVVERAASQQ YAFRVLLVLV AGLVTALASS LLGLEAQQVL ALTAFLMTIY ATLLLWTYRL 
PFAFLGVSAL FLLGVLDVEY FVEHSHLDVI AFLIAMMTIV GYLEEDRFFE FIAQEIVRRV 
GVNFRATFLV VVFLSGFLAP LVDEVTSILV MLSVVLPLSG KIGVDPLPLV IASIFATNIG 
SAMTPLGNPV GVLVAFESGL TFSDFLARAA PVSALSLVVA AAILMHLFRG YIEEGNALAS 
QRFTDGWSVA SLERRTLYRD ASVFSATILF IAAHHVLEEA LGLPKNSLLL AAPLMVAGLI 
MLLDPSRGFH ALETKVEWPT LVFFLLLFAS VGALEKTGVV EVLSKSLGSL SASGVGAFMG 
AFTLSSSLMS AFMDNVIAVA ILSRVVHELG AQGFHTEPFW WLTLFSAVYA GNLSPIGSTA 
NIVALSVLEK RLGRSAGFKE WLRVGLPVTA ATLALGFAAV YLQIP