Gene Tmz1t_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_1035
Symbol
ID	7084019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	1132704
End bp	1134044
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	643698053
Product	sodium:neurotransmitter symporter
Protein accession	YP_002354693
Protein GI	217969459
COG category	[R] General function prediction only
COG ID	[COG0733] Na+-dependent transporters of the SNF family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAAGC ACGCACACAG CCAATGGTCG TCGCGGATGG GCTTCGTGCT CGCCGCCACC 
GGCTCCGCCG TCGGCCTCGG CAACATCTGG AAGTTTCCCT ACATGGTCGG CCAGAGCGGC 
GGCGCCGCCT TCGTGCTGGT CTACCTGGCC TGCATCGCCT TCATCGGCGT GCCCATTCTG 
GTCGCGGAGT GGATGATCGG CCGGCGCGGG CAGAAGAACC CGATCAACAC CATGGCCCAG 
GTCGCGCGCG ACAACGGCCA CAGCACCAAC TGGGCCGTGG TGGGCGCGAT CGGCGTGCTC 
GCCGCCTTCC TGATCCTGTC CTTCTACTCG GTGATCGGCG GCTGGGCGCT GGCCTACATG 
CGCGACGCCG CCACCGGCGC CTTCATCGGC CTGGACAAGG CGGCGATCGG CGGCGCCTTC 
GAGGGCTTCC TCGCCCGCCC GGCCGAGCTG CTGACCTGGC ACTCGATCTT CATGCTGCTC 
ACCGTCGTCG TCGTGGCGCT CGGCGTGTCC GCCGGCCTGG AGCGCGGCAC CAAGCTGATG 
ATGCCGGCGC TCGGGGTGAT CCTGCTGGTG CTGGTCGGCT ACGCGATGAC CACCGGCAGC 
TTCGGCCAGG GCCTCGCCTA CCTCTTCAAC CCGGACTGGA GCAAGCTCGA CGGCAAGGTG 
CTGCTCGCCG CGCTCGGCCA CGCCTTCTTC ACCCTGTCGC TGGGCATGGG CATCATGATG 
GCCTACGGCT CCTACCTCGG GCAGGAGGTG AACCTGCTGC GCGCCGCGCG CACCGTGGTG 
ATCATGGACA CGGTGTTCGC GCTGTGCGCC GGCATGGCGA TCTTCCCGAT CGTGTTCGCC 
AACGGCCTGG ACCCCGCGGC CGGCCCCGGC CTGGTGTTCG TGACCCTGCC GCTGGCCTTC 
GGCCACATGG GCGGCGGCCT GGTCATCGGC GCACTGTTCT TCCTGCTGCT GACCTTCGCC 
GCGCTGACCT CGTCGATCTC GCTGCTCGAG CCGGTGGTGG AGCTGATCGA GGAGCGCACC 
CCGCTCGGCC GCGTCGCCGC CACGCTGATC GCCGGCATCA CCATCTGGGC GCTGGGCATC 
GCCGCGCTGC TGTCCTTCAA CGTGTGGAGC GACGTCAAGC TGCTCGGCAT GAACATCTTC 
GACCTGCTCG ACTATGCGAC CAGCAAGTTC ATGCTGCCGC TCGCCGGCCT GGGTGCAATC 
GTGTTCGCGG CGTGGAAGCT GGACCAGCAG GGCGTGAAGG CGGAACTGGG CCTTGGCGAT 
GCCACATTCG GCTTGTGGAC CCTGCTGTCG CGCTACGTCG CGCCGGTGGG CGTGCTGTTC 
GTGTTCTGGA GCAACCTGTA G

Protein sequence

MAKHAHSQWS SRMGFVLAAT GSAVGLGNIW KFPYMVGQSG GAAFVLVYLA CIAFIGVPIL 
VAEWMIGRRG QKNPINTMAQ VARDNGHSTN WAVVGAIGVL AAFLILSFYS VIGGWALAYM 
RDAATGAFIG LDKAAIGGAF EGFLARPAEL LTWHSIFMLL TVVVVALGVS AGLERGTKLM 
MPALGVILLV LVGYAMTTGS FGQGLAYLFN PDWSKLDGKV LLAALGHAFF TLSLGMGIMM 
AYGSYLGQEV NLLRAARTVV IMDTVFALCA GMAIFPIVFA NGLDPAAGPG LVFVTLPLAF 
GHMGGGLVIG ALFFLLLTFA ALTSSISLLE PVVELIEERT PLGRVAATLI AGITIWALGI 
AALLSFNVWS DVKLLGMNIF DLLDYATSKF MLPLAGLGAI VFAAWKLDQQ GVKAELGLGD 
ATFGLWTLLS RYVAPVGVLF VFWSNL