Gene BAS4990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4990
Symbol
ID	2851996
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4865716
End bp	4866744
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	41%
IMG OID	637508244
Product	gapA transcriptional regulator CggR
Protein accession	YP_031229
Protein GI	49187976
COG category	[K] Transcription
COG ID	[COG2390] Transcriptional regulator, contains sigma factor-related N-terminal domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTCAT GGATTCAGAA CACAAAAAAA TTATTACCTG ATCTGCTACC TGTTATGCAA 
ACGAGAATGC AAATTCTTCA ATACATTAGG CTCATGCAGC CGATTGGAAG AAGAAACTTA 
TCAGCAAGTC TCGGTATGAC AGAACGAGTA TTGCGAAGTG AAGTTCAAGT TTTGAAAGAA 
CAAAACTTAG TTCACGTCGC TTCTTCTGGA ATGACATTGA CAGAAGAAGG AACAGCTTTA 
GTTCTTGCTT TGGAAGACTT TATGAAAGAA ATTTCCGGGT TAAAGGTTTT AGAAAAGCAA 
CTTAAGGAAA CATTAGACTT GGATGAAGTT TTCGTTGTCC CTGGTGATAG TGATGAATCG 
CCTTGGGTCA AACTGGAGAT GGGCCGTGCT TGTGTGACTT GTATAAAAGA CCGTCTGACA 
GCGAATAATA TCGTTGCTGT GGCTGGAGGA ACTACGCTAG CTGCTGTTGC GGACATGATG 
CAGCTTGATT GCAAAGATTT ACATATGCTA TTTGTCCCAG CACGTGGTGG AATTGGAGAA 
GGCGTTGAAT TAGAAGCCAA TACCATTTGT GCCAAAATGG CGCAAAATAC GATGAGTAAT 
TATCGCTTAT TGTATGTCCC AGACCATGTT AGCAGCGAAG CATATGCGTC TATTGTGACA 
GAGCCTTCCG TGAAAGAAGT TCTTGAGTTG ATTCGATCTT CCAATATCGT CATTCATGGA 
ATAGGTGATG CGTTAACAAT GGCACGCCGC AGAAATACTT CAGAAGCAGA TTGGTTAAAG 
ATTCAGGCAA GCGAAGCAGT TGGTGAAGCT TTCGGTTATT ACTTTAATGA ACAAGGAAAT 
GTTGTTCATA AAGTAAGAAC AGTTGGTATG CAACTTGAGG ATTTACAAAA TGTATCTCAC 
GTTGTTGCAG TCGCTGGAGG TTCTTCAAAG GCAAAGGCAA TACAGGCTGT AATTAAACAA 
GGGCACACTT CAATTCTAAT TACAGATGAA GGTGCAGCAA AACAGTTAAC AAAGGGTATT 
ACCCTTTAA

Protein sequence

MRSWIQNTKK LLPDLLPVMQ TRMQILQYIR LMQPIGRRNL SASLGMTERV LRSEVQVLKE 
QNLVHVASSG MTLTEEGTAL VLALEDFMKE ISGLKVLEKQ LKETLDLDEV FVVPGDSDES 
PWVKLEMGRA CVTCIKDRLT ANNIVAVAGG TTLAAVADMM QLDCKDLHML FVPARGGIGE 
GVELEANTIC AKMAQNTMSN YRLLYVPDHV SSEAYASIVT EPSVKEVLEL IRSSNIVIHG 
IGDALTMARR RNTSEADWLK IQASEAVGEA FGYYFNEQGN VVHKVRTVGM QLEDLQNVSH 
VVAVAGGSSK AKAIQAVIKQ GHTSILITDE GAAKQLTKGI TL