Gene GWCH70_0304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_0304
Symbol
ID	7977423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	+
Start bp	347506
End bp	348543
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	44%
IMG OID	644797297
Product	peptidase S58 DmpA
Protein accession	YP_002948497
Protein GI	239825873
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3191] L-aminopeptidase/D-esterase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAA AGATTCGGGA ATTAGGCATT GAAATTGGAT CGCTGGAAAC GGGAAAGCAT 
AATCAGATCA CTGATGTTCC TGGAGTTAAG GTAGGACATG TAACATTAAA GAAAGAGTTG 
GATGAAAAGA CGGTCATTCG AACAGGAGTT ACGGCTATTC TTCCTCATGG AGGCAATATT 
TTTTTGCAAA AGGTGCCTGC TTCGTGTTTT GTTTTAAATG GATTTGGGAA AACAGCGGGA 
TTAGTGCAAG TGGAAGAGTT AGGGGTTATG GAATCACCGA TTATGCTTAC GAATACGTTC 
AGTGTGGGCA CAGTCTGGCA AGGAACATTG GAATATTTAA TGGAACAAAA TCAAGAAATA 
GGGGATACGA CTAGTTCAGT GAATATCGTA GTAGGTGAAT GCAATGACAG CTATCTAAAC 
ACGGTTCATT TTCCTGTCAT CGAAAAAGAA CATGCAAAAC TAGCGATAGA GCAGGCTGTT 
TTTGATGTCG AAGAGGGTGC GGTGGGTGCA GGCACTGGTA CGATGTGTTT CGGCTATAAA 
GGGGGAATTG GCAGTTCTTC GCGAATCATC CATGGAGGGA TTTACACCGT TGGCGCATTG 
GTTCTTAGCA ATTTTGGCAA AAGGGAAGAG TTGTGCATTG CACAGTATCG AAAACCATCA 
TTTGATGAAA CAGAAATTCC GAATGGTTCT ATTATGATTA TTGTCGCAAC CAACGCTCCT 
TTGAGCTCTC GTCAATTGAA GCGGCTGGCA AAACGTGCAG CCTTCGGGCT CGCTCGAACA 
GGAAGCCATA TTCACCATGG AAGCGGAGAT ATCATCATCG CATTTTCGAA CGGATACACT 
ATCCCCCACT TTTCTGAGTC ATCTTATTAT CAACTTCCGC CGCTCATTCG CGATGATGAT 
CCATTGATGA ATGAGCTGTT TCAAGCAGCC ATCGAGTCAA CGGAGGAAGC CATCTTAAAT 
TCGTTGACAA TGGCAGAGAC GACAACCGGA CGGAACGGGC GAATTGGTGA GGCTATTCCG 
TATGACCTTT TTCAATGA

Protein sequence

MRKKIRELGI EIGSLETGKH NQITDVPGVK VGHVTLKKEL DEKTVIRTGV TAILPHGGNI 
FLQKVPASCF VLNGFGKTAG LVQVEELGVM ESPIMLTNTF SVGTVWQGTL EYLMEQNQEI 
GDTTSSVNIV VGECNDSYLN TVHFPVIEKE HAKLAIEQAV FDVEEGAVGA GTGTMCFGYK 
GGIGSSSRII HGGIYTVGAL VLSNFGKREE LCIAQYRKPS FDETEIPNGS IMIIVATNAP 
LSSRQLKRLA KRAAFGLART GSHIHHGSGD IIIAFSNGYT IPHFSESSYY QLPPLIRDDD 
PLMNELFQAA IESTEEAILN SLTMAETTTG RNGRIGEAIP YDLFQ