Gene GBAA_4612 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_4612
Symbol
ID	2816249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	4190306
End bp	4191361
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	35%
IMG OID	637791303
Product	hypothetical protein
Protein accession	YP_021259
Protein GI	47529910
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00000312577
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAAAGA AGCGTAGACG CATTTTTTTA TTTTCGATTA TTGCACTGCT TTTAGTTTGT 
GGTTCAGTCT ATGCGTATAT TTCATCCGCA TTAGGACCAG TTGATACCGG GAATAAAAAA 
GAGATTGAAG TAGAAATTCC AAAGGGATCA TCTACTAGTA AAATTGGTGA GATTTTAGAA 
GAAAAAGGTG CTGTGAAAAA CGGTACAGTT TTTAGTTTTT ATACAAAGGC TAAATCTAAA 
AATTTACAAG CGGGTACATA TTTATTAAAT CCTTCAATGA GTGCGAAAGA TGTTATGGAG 
CAAATGTCAT CTGGTAATGT ACATCGTCCA GCTCTTTATA AAGTGACGAT AAAAGAAGGA 
GCACAAGTAA CTGAAATTGC AGAAACGGTT GCAAACGAAT TAAAGTGGAA TAAAGATGAT 
GTCGTACGTC AATTAAACGA TAAAGCATTT ATTCAAAAAA TGCAGCAAAA GTATCCGAAG 
TTGTTAACCG ATAAAATCTT TGATAGCAAT ATTAAATATC CGTTAGAAGG TTATTTATAT 
CCTGCGACGT ACTCTTTCTA TAAAAAAGAT ACGACGTTAG AAGAAGTTGT AATTCCAATG 
CTTGAAAAAA CGAATGCAAT CATTGTTCAA AACGAGGCAA AAATGAAAGC GAAAAACTGG 
GATGTTCACC AGCTTTTAAC ATTGTCTTCA CTTATTGAAG AAGAGGCAAC AGGCTTTACA 
GATCGTCAAA AGATCTCTAG TGTCTTTTAT AATCGTTTAG CAAAAGGCAT GCCACTGCAA 
ACTGATCCGA CGGTATTATA TGCACTTGGA AAGCATAAAC AACTTGTGTT ATACGAAGAT 
TTAAAGGTTA ACTCACCATA CAATACGTAT GTGGTGAAAG GATTGCCTGT CGGTCCGATT 
GCAAACTCTG GCAAACATTC AGTGGAAGCG GCGTTAGAAC CCGCGCAAAC AGATTATTAT 
TATTTCTTAG CTGCACCAAC TGGTGAAGTG TATTATGCGA AAACATTGGA AGAGCATAAT 
GCATTAAAGC AAAAATATAT TACGAAAAAG CAGTGA

Protein sequence

MKKKRRRIFL FSIIALLLVC GSVYAYISSA LGPVDTGNKK EIEVEIPKGS STSKIGEILE 
EKGAVKNGTV FSFYTKAKSK NLQAGTYLLN PSMSAKDVME QMSSGNVHRP ALYKVTIKEG 
AQVTEIAETV ANELKWNKDD VVRQLNDKAF IQKMQQKYPK LLTDKIFDSN IKYPLEGYLY 
PATYSFYKKD TTLEEVVIPM LEKTNAIIVQ NEAKMKAKNW DVHQLLTLSS LIEEEATGFT 
DRQKISSVFY NRLAKGMPLQ TDPTVLYALG KHKQLVLYED LKVNSPYNTY VVKGLPVGPI 
ANSGKHSVEA ALEPAQTDYY YFLAAPTGEV YYAKTLEEHN ALKQKYITKK Q