Gene BAS4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4191
Symbol
ID	2852180
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4105986
End bp	4107107
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	38%
IMG OID	637507427
Product	hypothetical protein
Protein accession	YP_030439
Protein GI	49187187
COG category	[S] Function unknown
COG ID	[COG3323] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR00486] dinuclear metal center protein, YbgI/SA1388 family

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.000743156
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA TTCCAAATGG CCATGAAATT ATTTCTTTAT TTGAAAGTAT GTATCCGAAG 
CATTTGGCGA TGGAAGGAGA TAAGATTGGC CTGCAGATTG GAGCGCTTAA TAAACCCGTG 
CAGCACGTAT TAATTGCGTT AGATGTAACG GAAGAAGTTG TGGATGAAGC AATTCAATTA 
GGAGCGAATG TCATTATTGC GCATCATCCT TTAATTTTTA ACCCGCTAAA AGCGATTCAT 
ACAGATAAGG CGTATGGGAA AATTATTGAA AAGTGTATTA AAAATGATAT TGCAATCTAT 
GCAGCACATA CAAATGTGGA TGTTGCTAAG GGCGGGGTAA ATGATTTACT TGCTGAGGCG 
TTAGGATTGC AAAATACAGA AGTTTTGGCA CCGACATATG CAGAAGAAAT GAAAAAAATT 
GTTGTGTTTG TGCCTGAAAC TCATGCAGAA GAAGTAAGAA AAGCATTAGG AGACGCAGGC 
GCTGGTCATA TCGGCAATTA TAGCCACTGT ACGTTTAGTA GCGAGGGTAC AGGCGCGTTT 
ATACCTCAAG AGGGAACAAA TCCTTATATC GGGGAAACTG GGCAGTTAGA ACGCGTGGAA 
GAAGTGCGAA TCGAAACGAT TATTCCAGCT TCATTACAGC GAAAAGTAAT TAAAGCAATG 
GTAACGGCAC ATCCATATGA AGAAGTAGCA TATGATGTGT ATCCACTTGA TAACAAAGGT 
GAAACATTAG GGCTTGGAAA AATAGGATAT TTACAAGAAG AAATGACACT TGGACAATTT 
GCGGAACATG TAAAGAAGTC ATTAGATGTA AAGGGTGCGC GAGTTGTTGG GAAATTAGAT 
GATAAAGTGC GCAAAGTAGC TGTACTTGGT GGCGATGGTA ACAAATACAT CAATCAAGCT 
AAATTTAAAG GAGCAGATGT ATATGTAACG GGGGACATGT ATTATCATGT TGCTCATGAT 
GCGATGATGC TCGGTTTAAA TATAGTTGAC CCAGGACATA ACGTTGAAAA GGTAATGAAG 
CAAGGTGTAC AAAAGCAATT ACAAGAAAAA GTGGATGCAA AGAAACTTAA TGTAAACATT 
CATGCTTCGC AGTTACATAC AGATCCATTT ACATTTGTAT AA

Protein sequence

MSKIPNGHEI ISLFESMYPK HLAMEGDKIG LQIGALNKPV QHVLIALDVT EEVVDEAIQL 
GANVIIAHHP LIFNPLKAIH TDKAYGKIIE KCIKNDIAIY AAHTNVDVAK GGVNDLLAEA 
LGLQNTEVLA PTYAEEMKKI VVFVPETHAE EVRKALGDAG AGHIGNYSHC TFSSEGTGAF 
IPQEGTNPYI GETGQLERVE EVRIETIIPA SLQRKVIKAM VTAHPYEEVA YDVYPLDNKG 
ETLGLGKIGY LQEEMTLGQF AEHVKKSLDV KGARVVGKLD DKVRKVAVLG GDGNKYINQA 
KFKGADVYVT GDMYYHVAHD AMMLGLNIVD PGHNVEKVMK QGVQKQLQEK VDAKKLNVNI 
HASQLHTDPF TFV