Gene Tneu_1513 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_1513
Symbol
ID	6165825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	-
Start bp	1345274
End bp	1346401
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	63%
IMG OID	641668670
Product	major facilitator transporter
Protein accession	YP_001794883
Protein GI	171185964
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.519208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATATA CGTCGTCGGC TACGAACACG TCAAGAGCTG ATTTAAGAGC CTACGTCCTC 
CTCTCTACGC CCTACTCCTT CGTAGTCTTC CTACTGCCGT TCTATGTGCT TGAGATAGGC 
GGCGGCTCGG TAGAGGTCGG CGTGGCCTAC GCGTCATATG CGGCGGCTGT GGTGGTGACG 
CGTCCTACGT CGGGCGCGTT GGCGGATAAG TTCGGCAGAC GCAGGGTTAT GCTACTGGGT 
GGCGCAACGC TGGCGGTTTC GATGGCCCTT CTGGCACTTT CCACCGGGGT GGCCCACGTG 
TACATATCCC TCTTCTTGGC TGGAGCGGCG TCCAGCTTAG TCAACGTGGC GGCTCTGGCT 
TATGTGTCAG ACGTCGGCGG GCTGGAGGAC CCCGCGCTCT ACTCGAGGCT GAAGACCGCG 
GCGGCCTTAG GCGCGTTGGC GGGCGGGGCG TCCATCCCGG CTGTGTATGT CCTCTCTAGG 
CTTCTCAGCT TCGCAGACGC CTTTAGGCTT GTGGCGGCTG TTCTAGCACT TCTGGCCGTC 
TCAGCTCTTT TGGCCGTCCC GGGCGAGACG AAGCACCTTG CCGCCAGACA CAAGAAGGGC 
GACCGGGTCC AGACCTTCTG CGTGATGTCG CTGGCTACGG CGTTCGGCTC CGCGGTGGGC 
CTCTACGGCC CTCAGGTGAT GCTCTACCTC CACAGGAGGT ACTCGCTGTC TCCCTACACC 
GCCGTCGTGG CGTATCTACC CTCGGTGGTG TCGTGGATAG TGGGGCCTAG GCTTGCGGGG 
CCCGCCTATG CGAGGTTGAT CGCGGGAGGC GCCGCGATGG CTCTAGCGCT CGTGGGCATG 
GCGGTCTCTC CATCGCCGTA TGTCTTCTCG GCGTTTTGGG CCATCGAGAG CCTTGGGGTC 
GCCGCCGTCT CAACCTCCCT AGACCAGAGG CTGGTTAGAC ACGTCGCCGG GTCCTACTGG 
GGTAGGGGCT ACGGCCTCTA CCAGGCGTTG TACAATCTGG GTTACTCCGC CGCGGCAGCC 
GTCTCGGGCT TCTTCGACGA CCCCTTCACC CCCGCGCTGG CCCCCCTCTC CGCGGCTTTG 
CTCACGGCGG CTGTGTGTAG TAACCTACAA AAACGCCGAG CGGCATGA

Protein sequence

MGYTSSATNT SRADLRAYVL LSTPYSFVVF LLPFYVLEIG GGSVEVGVAY ASYAAAVVVT 
RPTSGALADK FGRRRVMLLG GATLAVSMAL LALSTGVAHV YISLFLAGAA SSLVNVAALA 
YVSDVGGLED PALYSRLKTA AALGALAGGA SIPAVYVLSR LLSFADAFRL VAAVLALLAV 
SALLAVPGET KHLAARHKKG DRVQTFCVMS LATAFGSAVG LYGPQVMLYL HRRYSLSPYT 
AVVAYLPSVV SWIVGPRLAG PAYARLIAGG AAMALALVGM AVSPSPYVFS AFWAIESLGV 
AAVSTSLDQR LVRHVAGSYW GRGYGLYQAL YNLGYSAAAA VSGFFDDPFT PALAPLSAAL 
LTAAVCSNLQ KRRAA