Gene Tpen_1640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1640
Symbol
ID	4600919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	1587755
End bp	1589266
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	64%
IMG OID	639774413
Product	amino acid permease-associated region
Protein accession	YP_921038
Protein GI	119720543
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.469925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTAAGC TACGGCGCGA GCTGGGGTTA CTGGAGCTTG TAGGTATCAG CGTGGGCGGG 
ATAATAGGCT CGGGTATATT TATGATGCCT TCCCTAACCC TCTCGACGGC AGGTCTCAGC 
GCGTTGCTCG CCTGGATCCT CGCCGGGGTA GCGATGACCG TCGTCGCCCT GGTTTTCGCC 
GAGCTAGGGT CAGCCTTCGG GGATACAGGT GGGCCCTACG TCTACGCGCG GGCCGCTTTC 
GGGCGGACCG TGGGCTTCCT GGTGGGCTGG GGCTACTACG TCTCCTGCGT TCTAACCGTC 
TCAGCCGTTA CCGCGGCGTT TGTAAGCTAC CTTGGCTTCT TCGTGCCGGG GCTCGTTGAG 
GGTCAGCGGT TAACGCCCGT AGGAGTTCTG GCGGGGCTAG CCTTCCTCTG GTTCCTCACT 
TTGCTGAACT ACGTCGGCGT GAAGTACGGG GGGCTCTACG CCTCCGCGAC GACTCTGCTC 
AAGGTGTTCG CACTGGCTAT CTTCGCGGCG GCGGGCCTCG CCTACCCGGA GCCCTCGCGG 
TTCAACGTGC TGGAGGGGCT GGACGCCGTC TCGCTTGGGC TCGCCGTCTC CCTGGCTGTC 
TGGCCGTACA TGGGCTTTGA GAGCGTAACG ATACCGGTCG AGGAGGTGAA GAAGCCTCAG 
AGAGACGTAC CACTCTCGAT AATCCTCTCG ATGGGTATCG TCACGGCGGT CTACGTGTTG 
ATAGTGCTGT CGTTCCTGAG CCTCCTGGAC TGGAAGTCGC TGGGGCTCGC GCAGGGGGAC 
TGGGGGTCCC TGGCGAACCT CTCCTCGCCT TTATCCGACG TCGCGAGGTC GAGGGGGCTA 
CTCGCGGTGG CAGTAGCGGT GATGCTGGGC GCGGTCTTCT CGACGGGCGG CGCCAGCGGG 
GTGTGGCTTC TCGACAGCGG GCGCTTCCCC TACGCCTTCT CGCAGGCGGG GGACCTTCCC 
AAGGTCCTCG GGAAGGTTCA CGACCGCTAC GGTACCCCGC ACGTAGGGCT CCTGCTCTCG 
TCTATCGTGG CGAGCGCCGT GCTCGTACTC CTGCCGCTCT TCCCGGCGAT CGCGCTTCTC 
GGCGTGATGA CCTCGATAGT CCCGTACGCC GTGTCGTCCC TCGGGCTCGC CGTGCTACGC 
GGAAGGGGCG ACTACAGGCC AGCCTTCAGG AACCCCTTCG GGAAGCTCGT TGCCTACGTC 
TCCTTCGTTT TCTCGACACT CGTGGCGTAC TGGTCCTGCT GGCCGTGGAC CCTCGTAGGA 
GCCCTGCTGA CACTCGCCGT CGTCCCCGTC TTTGCGCGCG TAGCCGGGGT GGGGCTTAGG 
AGGGAGGACC TCTGGTACTT CGCCTACCTC TCGGGCTTGA GCGTCGTCTC CCTCCTCGGG 
GACCCGTACT TCGAGTACTA CAACTTCCTC CCGGTGCACC CCCTGGGAGT CTTCAAGACC 
CCGGTGGACA TAGCCGTCCT GGTGGTCTTC GCGTCGGCGT TCTTCTTCTA CGTGGCGAGG 
ACCCGGCGGT AG

Protein sequence

MSKLRRELGL LELVGISVGG IIGSGIFMMP SLTLSTAGLS ALLAWILAGV AMTVVALVFA 
ELGSAFGDTG GPYVYARAAF GRTVGFLVGW GYYVSCVLTV SAVTAAFVSY LGFFVPGLVE 
GQRLTPVGVL AGLAFLWFLT LLNYVGVKYG GLYASATTLL KVFALAIFAA AGLAYPEPSR 
FNVLEGLDAV SLGLAVSLAV WPYMGFESVT IPVEEVKKPQ RDVPLSIILS MGIVTAVYVL 
IVLSFLSLLD WKSLGLAQGD WGSLANLSSP LSDVARSRGL LAVAVAVMLG AVFSTGGASG 
VWLLDSGRFP YAFSQAGDLP KVLGKVHDRY GTPHVGLLLS SIVASAVLVL LPLFPAIALL 
GVMTSIVPYA VSSLGLAVLR GRGDYRPAFR NPFGKLVAYV SFVFSTLVAY WSCWPWTLVG 
ALLTLAVVPV FARVAGVGLR REDLWYFAYL SGLSVVSLLG DPYFEYYNFL PVHPLGVFKT 
PVDIAVLVVF ASAFFFYVAR TRR