Gene GWCH70_2121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2121
Symbol
ID	7976932
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2190532
End bp	2191659
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	43%
IMG OID	644798937
Product	glycosyl transferase group 1
Protein accession	YP_002950097
Protein GI	239827473
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCTAA AAATAGGGAT TGTTTGTTAT CCAACAGTAG GCGGCTCTGG TGTCGTTGCG 
ACCGAATTAG GGAAATTGCT GGCAGAAAAA GGGCATGAAA TTCATTTTAT TTCTTCGAGC 
ATGCCGTTTC GTCTCAATAA AGTGTATGGC AACATTTATT ATCATGAAGT GGGCGTCAAT 
CAATATTCCG TATTTCAATA TCCGCCATAT GATTTAGCTC TGGCAAGCAA AATTGCTGAA 
GTGGCGAAGC GGGAGCGGCT CGATGTGTTG CATGCCCACT ATGCCGTTCC GCATGCGGTT 
TGCGCTGTAT TGGCGAAGCA AATGGTAGGC GGGAAATTAA AGATTGTTAC GACATTGCAC 
GGAACGGATA TTACGGTGCT TGGATATGAT CCATCGTTGA GCGATATGAT TAAATTTGGC 
ATTGAACAAT CAGATGTTGT CACCGCCGTT TCGAATGCGC TTGTCAAGCA GACGTATGAG 
CTTCTTGACG TACAAAAACC GATCCAAACC GTCTATAACT TTGTGGACGA GCGTGTATAT 
CACAAAAAAA ATGCCAATCA TTTAAAGAAA GAATATGGGA TTGATGAGAA CGAAAAAGTC 
ATCATTCATG TATCCAACTT TCGAAAAGTC AAGCGGGTTC CTGATGTTGT GCGCGCTTTT 
TCTCTCATTC GCAAGCATCT GCCTGCGAAA CTGCTGCTTG TCGGCGATGG ACCGGAAATG 
ACTGTCGTCA GCCGCCTTGT GACAGAGCTT GGACTTAGTG ATGATGTACG CTTTTTAGGA 
AAACAAGACA AGCTCGATGA ATTATATTCG ATTAGCGATG TGAAGATGCT ATTATCAGAA 
AAAGAAAGCT TTGGTCTTGT GCTATTAGAA GCGATGGCCT GCGGCGTTCC TTGCATTGGT 
ACGACGATCG GCGGCATTCC TGAAGTGATT GAAGACGGTA AAACAGGGTT TTTATGTGAG 
CTTGGAAATG TGGAAGAAGT GGCAAATAAA GCGCTTCGCA TTTTAACAGA CAAACATCTT 
CACATGTATA TGGCCAAGCA GGCGGTTCAA ACGGTATATC AAAAATTTTA TTCGGAACAA 
ATTGTGGAAC AATATGAAGA TATTTATTTT TCATTGGCAA AGGGGTGA

Protein sequence

MKLKIGIVCY PTVGGSGVVA TELGKLLAEK GHEIHFISSS MPFRLNKVYG NIYYHEVGVN 
QYSVFQYPPY DLALASKIAE VAKRERLDVL HAHYAVPHAV CAVLAKQMVG GKLKIVTTLH 
GTDITVLGYD PSLSDMIKFG IEQSDVVTAV SNALVKQTYE LLDVQKPIQT VYNFVDERVY 
HKKNANHLKK EYGIDENEKV IIHVSNFRKV KRVPDVVRAF SLIRKHLPAK LLLVGDGPEM 
TVVSRLVTEL GLSDDVRFLG KQDKLDELYS ISDVKMLLSE KESFGLVLLE AMACGVPCIG 
TTIGGIPEVI EDGKTGFLCE LGNVEEVANK ALRILTDKHL HMYMAKQAVQ TVYQKFYSEQ 
IVEQYEDIYF SLAKG