Gene GWCH70_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GWCH70_2371
Symbol
ID	7979067
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacillus sp. WCH70
Kingdom	Bacteria
Replicon accession	NC_012793
Strand	-
Start bp	2412580
End bp	2413626
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	45%
IMG OID	644799174
Product	type II secretion system protein E
Protein accession	YP_002950334
Protein GI	239827710
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2804] Type II secretory pathway, ATPase PulE/Tfp pilus assembly pathway, ATPase PilB
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAA TTGAATATGT TGCCGATCGT CTCATAAAAG AAGCGAGTTT GCTTCATGTA 
TCTGACATTC ATATCGTTCC GCGCAAAGAC GATGCGATTG TGCGTTTCCG GTTAGATGGA 
TTGCTGATGG AAAAGGAAGC GCTGACAAAA GAAATGTGCG AGCGGCTTAT TACGCATTTT 
AAATTTTTAG CAGGGATGGA CATTGGCGAA CGCCGCCGTC CGCAAAGCGG AGCGATGGAA 
GCAAGGCATC AGGAAGAAAT CATTCACTTA CGCCTCTCCA CATTACCGAC ATCGTATGAT 
GAAAGCCTCG TTATCCGGCT TCTTCCGCAG AATTTTTTTA TTCCTCGATC ACAACTTTCT 
CTATTTGCAA ATGCCACGAA AACGTTACTT TCCCTTTTTC GGCAGCCCCA AGGATTAATT 
ATTTTTACAG GACCAACTGG ATCAGGCAAA ACGTCAACAT TATATACGTT ATTGCGCATT 
TGTCAATATG AGTGGCATCG CAATGTCATC ACATTGGAAG ACCCTGTTGA AAAGCGAATC 
GACAACATAT TGCAAGTGCA AATTAATGAG AAAGCGGGAA TTACGTATAC AACCGGTTTA 
AAAGCTGTTT TGCGCCATGA TCCGGATGTG ATTATGATCG GCGAAATTCG CGACGCCGAG 
ACCGCAAAAA TTGCGGTACG CTCAGCAATG ACGGGACATT TGATTGCTAC GACCATGCAT 
ACAAAAAACG CTGTTGGTGC GATTTACCGT TTGCGTGAAT TCGGGATTCC GCTTGGAGAT 
ATTGAGCAAA CATTGCTCGC CGTTGTCGCA CAGCGGCTCG TGGACTTAGT ATGCCCGTTT 
TGCGGTGAAC ATTGCTCCAT ATTTTGCCGT AAATATCGCC CCATTCGCCG CGCTGCTGTC 
CATGAATTGC TGTATGGGAA TGCTTTGTCG AACGCCATTC AATCCGTACA AACAAAGGAA 
AAGACGCATC ACTACTATAC GTTGCAACAC GTTATTCGAA AAGGAGTTGC TCTTGGATTT 
TTGCCAGCAC ACCTTCTTTA CAGGTAG

Protein sequence

MNEIEYVADR LIKEASLLHV SDIHIVPRKD DAIVRFRLDG LLMEKEALTK EMCERLITHF 
KFLAGMDIGE RRRPQSGAME ARHQEEIIHL RLSTLPTSYD ESLVIRLLPQ NFFIPRSQLS 
LFANATKTLL SLFRQPQGLI IFTGPTGSGK TSTLYTLLRI CQYEWHRNVI TLEDPVEKRI 
DNILQVQINE KAGITYTTGL KAVLRHDPDV IMIGEIRDAE TAKIAVRSAM TGHLIATTMH 
TKNAVGAIYR LREFGIPLGD IEQTLLAVVA QRLVDLVCPF CGEHCSIFCR KYRPIRRAAV 
HELLYGNALS NAIQSVQTKE KTHHYYTLQH VIRKGVALGF LPAHLLYR