Gene GWCH70_0297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0297
Symbol
ID	7979094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	336000
End bp	337127
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	47%
IMG OID	644797290
Product	glycine betaine/L-proline ABC transporter, ATPase subunit
Protein accession	YP_002948490
Protein GI	239825866
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1125] ABC-type proline/glycine betaine transport systems, ATPase components
TIGRFAM ID	[TIGR01186] glycine betaine/L-proline transport ATP binding subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCGCT TTGAAAACGT ATGGAAACAA TATGACGACG GTTTTGTCGC ATTGAAAAAT 
ATTAATCTCG AAATTCAAAA AGGAGAATTG GTCACTTTAA TCGGGCCAAG CGGATGCGGA 
AAAACGACGA CGATGCGGAT GATTAACCGC CTGACTGAAC CGACGTCTGG AACGATATAC 
ATTGACGGGC AGGACATTGC AAAAATGAAT CCAGTGGAAC TACGACGCAA CATTGGCTAT 
GTCATCCAGC AAATCGGGCT GTTCCCTCAT ATGACGATTG CGGAAAATAT CGCCTTAGTT 
CCGAAACTAA AAAAATGGGA GCCGTCCGCC TATCAAAAAC GGGTTGACGA ACTGCTTGAT 
CTTGTCGGAT TAGATCCAGC GATGTTTAAA CATCGCTACC CGTCGGAACT TAGCGGTGGC 
CAGCAACAAC GAGTCGGCGT TATTCGCGCC CTTGCCGCAG AGCCTGACAT CATTTTGATG 
GACGAGCCGT TCAGCGCGCT CGATCCGATC AGCCGCGAAC AGCTGCAAGA GGATATTGTG 
AAATTGCAGG AAGAAATTCG AAAGACAATT GTGTTTGTCA CACATGATAT GGATGAAGCG 
ATTAAAATTT CCAACCGTAT TGCAATTATG AAAGACGGAG AAATCGTGCA ATTTGCTACG 
CCGGATCAAA TTTTGCGCCG TCCTGTCAAT TCATTCGTAC GCGACTTTAT TGGAGAGAAC 
CGCCTTGCAC AAAGACAAAC GGCCGTGCCG ACAGCGGAAG ACTTAATGTC CCATTCCATC 
GCTACGATAT CGCCGAAGCG CGGATTAGCC GAGGCCTTCC GGTTCATGAA AGAGAAAAAA 
GTAGACAGCT TAATCGTTAC AGATAAAAAA CAATCCTTTC TTGGTGTCGT GACATTAAAA 
AAACTAGAAA GACATTATCA GCAGGAACAT CTTCTTGTGA CCGACATCGC TGATTTCGAT 
GTGACGACAC TAACAAAGGA TGCTGATGTG ACGGAAGTTG CGGAAATTTT CCAGCAACAA 
GATGTCAGCG CCATCCCTGT ATTGGCCGGG AATCGCCTTG TCGGCGTTAT CACGAGATCG 
AGCATGATGC GCGGGCTGGC GGAATGGGAG TTTCAAAAGC AACCGTGA

Protein sequence

MIRFENVWKQ YDDGFVALKN INLEIQKGEL VTLIGPSGCG KTTTMRMINR LTEPTSGTIY 
IDGQDIAKMN PVELRRNIGY VIQQIGLFPH MTIAENIALV PKLKKWEPSA YQKRVDELLD 
LVGLDPAMFK HRYPSELSGG QQQRVGVIRA LAAEPDIILM DEPFSALDPI SREQLQEDIV 
KLQEEIRKTI VFVTHDMDEA IKISNRIAIM KDGEIVQFAT PDQILRRPVN SFVRDFIGEN 
RLAQRQTAVP TAEDLMSHSI ATISPKRGLA EAFRFMKEKK VDSLIVTDKK QSFLGVVTLK 
KLERHYQQEH LLVTDIADFD VTTLTKDADV TEVAEIFQQQ DVSAIPVLAG NRLVGVITRS 
SMMRGLAEWE FQKQP