Gene BAS1531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1531
Symbol
ID	2848689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	1561565
End bp	1562785
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	36%
IMG OID	637504785
Product	hypothetical protein
Protein accession	YP_027798
Protein GI	49184546
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AATTATTATT ATTGTCGGGA ACAGGAATTT CTCGTTTAGG TGATTTTATG 
TATCTTATCG CCTTAAACGT AATGGTGTTA CATAGCACAA ACTCCCCTGC TGCTGTAGCA 
GGATTATGGA TTGTAGGTCC AATTGCCACC GTATTTACGA AAATATGGTC TGGTAGCATA 
GTAGATCGAT TAAACAAACG GTCCATTATG CTTATCACAG ATATCATTCG GGCAGCTCTC 
ATTGGCTGTA TACCACTATT TGATTCTATT TGGGCCATTT ACATTTTTAT CTTTTTGACT 
CGCATTGCTA CATCATTTTT CGATCCGGCT TCATTTTCTT ATAAAACAAT GCTCATACGT 
GCTGAAGAAC GCGCGCAATT CAACGCTTGG AGTAACTTTT GTACAAGCGG AGCTTTCATT 
ATCGGTCCAG CTCTTGCTGG AATACTTCTC ACCACGCACT CAGCAACCTT TGTTATTTAC 
TGCAACTCAC TTTCCTTTCT ACTTTCTACC ATTTTCATTT ACTTCTTGCC AAACATTGCA 
TTACAAACAA AGCAAAACGA AGAAGTTGCA AATACTTTCG TACAAACATT ACGAAATGAT 
TGGAAACAAG TTTTTTCATT TGCTCGAACA GAAACTTACA TTATTCTCAT ATTCGTTTTA 
TTTCAAGCGA CTATGCTTGT CGCTATGGCA CTCGATTCAC AAGAAGTTGT TTTCACAAAA 
CAAGTACTGC TTTTATCCAA CATGGAATAT AGCATGCTTG TTAGTATAAC TGGTGCAGCT 
TACGTTTTCG GTTCATTTCT TGTTTCTCTC TTTGCTAAAC GATTACCGAT TCAATATTGT 
ATCGGATTCG GTATGATTTT TACAGCAATA GGCTATGTAA TTTTCGCTTT TTCAAATTCA 
TTTATCGTCG CAGCAGGCGG TTTTATTTTA CTTGGAGTGT CTTCATCATT TGCTGGTACT 
GGCTTTATAA CATTTTATCA AAATAACATA CCTGTACATA TGATAGGACG TATTGATAGC 
GTGTTTGATT CCATAAAAAG TTTTATCCAA GTCTTTTTCA TTTTAGCAAT TGGAGCATCC 
GCACAATTTC TTTCCGTCCA AATTACTGTA ATAAGTAGCT CGTTACTCAT TCTTTTCCTT 
TCCTGTTTAT TAGCAATCCG GGTAATGACT CCTTCACGTG AAAAATATTT TAAAGCGACA 
GAGTCATCAT TGGAATACTA A

Protein sequence

MKNKLLLLSG TGISRLGDFM YLIALNVMVL HSTNSPAAVA GLWIVGPIAT VFTKIWSGSI 
VDRLNKRSIM LITDIIRAAL IGCIPLFDSI WAIYIFIFLT RIATSFFDPA SFSYKTMLIR 
AEERAQFNAW SNFCTSGAFI IGPALAGILL TTHSATFVIY CNSLSFLLST IFIYFLPNIA 
LQTKQNEEVA NTFVQTLRND WKQVFSFART ETYIILIFVL FQATMLVAMA LDSQEVVFTK 
QVLLLSNMEY SMLVSITGAA YVFGSFLVSL FAKRLPIQYC IGFGMIFTAI GYVIFAFSNS 
FIVAAGGFIL LGVSSSFAGT GFITFYQNNI PVHMIGRIDS VFDSIKSFIQ VFFILAIGAS 
AQFLSVQITV ISSSLLILFL SCLLAIRVMT PSREKYFKAT ESSLEY