Gene Tmz1t_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3089
Symbol
ID	7874559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	-
Start bp	3342880
End bp	3344052
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	66%
IMG OID	643700012
Product	Extracellular ligand-binding receptor
Protein accession	YP_002890064
Protein GI	237653750
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGCA CGTTCAAACT CGCCGGCAAC CTCGCCCTGA CCCTCGCGCT GGCCGCTGCC 
GGCATCGGCG CCGCGAACGC GGCCGACAAG GTCAAGGTCG GCCTGATGCT GCCCTACACC 
GGCACCTACG CCGCGCTCGG CACCGCGATC ACCAACGGCT TCAAGCAGTT CGTCGACGAG 
AACGGCGGCA AGCTCGGCGG CCGCGAGGTC GAATACTTCA CCGTCGACGA CGAGTCCAAC 
CCGGCCAAGG CGACCGAGAA CGCCAAGAAG CTGGTCTCGC GCGACAAGGT CGACGTGCTG 
GTCGGTACCG TCCACTCCGG GGTCGCGCTC GCCATGGCCA AGGTGGCCCG CGACACCAAG 
ACCCTGATGA TCGTCCCCAA CGCCGGCGCC AACGAGCTGA CCGGCCCGCT GTGCTCGCCC 
TACATCTTCC GCTCGTCCTT CTCGGCCTGG CAGCCGTCCT ACGCGATGGG CGAGGCGCTT 
GCGAAGAAGG GCATCAAGAA CGTCGCCACG GTGACCTGGA AGTACTCCTT CGGCGAGGAG 
TCGGTCGCCG GCTTCAAGGA AGCCTTCGAG AAGGGGGGCG GCAAGCTCGT CAAGGAAATG 
ACCTTGCCGT TCCCCAACGT CGAGTTCCAG CCCTTCCTGA CCGAGATTGC CGCGGCCAAG 
CCCGATGCGG TGTTCGTCTT CTTCGCCGGC GCCGGCGCCG CCAAGTTCGT CGCCGATTAT 
GCCGCGGCCG GTCTCAAGAA CAGCATCCCG CTGTACGGCC CGGGCTTCCT CACCGACGGC 
AACCTCGGTG CGATGGGCGG AGCGGGCGAG GGCCTGCTCA CCACGCTGCA CTACGCCGAC 
GGCCTGACCC ACGCCAGGGA TGCGGCCTTC CGCACCAAGT ACGCGACGAC CTACAAGCTC 
CAGCCCGACG TCTATGCGGT GCAGGGCTAC GACGCCGCGC AGATGTACGA GGCCGGCCTG 
AAGGCCGCCG GCGGCGATCC GGAGAAGCAG GAAGAGATCA TCAAGGGCAT GGAGTCCGCC 
AAGATCGACA GCCCGCGTGG CGCCTTCACG CTGTCCAAGG CGCACAACCC GGTGCAGGAC 
ATCTACATGC GCCAGGTCAA GGGTGATCAG AACGTGATGC TCGAGATCGT CTCCAAGGGC 
CTCGAGGATC CCGCCCGCGG CTGCAAGATG TAA

Protein sequence

MKSTFKLAGN LALTLALAAA GIGAANAADK VKVGLMLPYT GTYAALGTAI TNGFKQFVDE 
NGGKLGGREV EYFTVDDESN PAKATENAKK LVSRDKVDVL VGTVHSGVAL AMAKVARDTK 
TLMIVPNAGA NELTGPLCSP YIFRSSFSAW QPSYAMGEAL AKKGIKNVAT VTWKYSFGEE 
SVAGFKEAFE KGGGKLVKEM TLPFPNVEFQ PFLTEIAAAK PDAVFVFFAG AGAAKFVADY 
AAAGLKNSIP LYGPGFLTDG NLGAMGGAGE GLLTTLHYAD GLTHARDAAF RTKYATTYKL 
QPDVYAVQGY DAAQMYEAGL KAAGGDPEKQ EEIIKGMESA KIDSPRGAFT LSKAHNPVQD 
IYMRQVKGDQ NVMLEIVSKG LEDPARGCKM