Gene BAS2956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2956
Symbol
ID	2852147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	2926123
End bp	2927553
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	35%
IMG OID	637506200
Product	deoxyribodipyrimidine photolyase family protein
Protein accession	YP_029213
Protein GI	49185961
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.13805
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAATA AAATTATCGT TATGTTTCAA AAAGATTTTC GCTTATATGA TAACCCAGCT 
CTATTTGAAG CGGCTCAGTC CGGTGAGGTT GTTCCGGTAT ATGTACATGA TGAAACTTTT 
TCAATGGGAA GTGCGTCAAA GTGGTGGTTA CACCATGCAA TAATAGATGT AAAGAAGCAA 
CTTGAGGCAT TGGGCTCTAC TTTAATCATT CGTAAAGGAA GTACGCAAGA AGAAATACTT 
TCTCTCGTAG AACAGTTAGG TATAACGGCT GTATATTGGA ATATTTGTTA TGATCCGGAC 
AGATTACAAT CTAATCAAAA AATGAAAATG ATGTTAGAAC ATAAAGGTAT GATCTGTAAG 
GAATTTAATT CACATTTATT ATTAGAGCCT TGGGTTATTA AAAAGAAAGA TAACACTGAA 
TATAAGGTGT TTACGCCTTT TTACAATGCA TTTCAAAAGC AGGTAATACA TAAGCCAATT 
AGTAAAGTGC AGAGTATAAA GGGAGGAAAC TCTTTACCAG TAAGCTTATC TGTTTCAGAA 
TTACACTTGT TGCCGACTAT ACCGTGGACA TCTCATATGG AATCAATATG GGAGCCTACA 
GAAGAAGGGG CATACAAAAC ATGGAAGGAA TTTTTCTCTA GCAAATTGGC CTCTTATAGT 
GAAGGAAGAG ATTTTCCAAA TCAAAATGCT CATTCAATGT TGGCGCCTTA TCTTTCATTT 
GGTCAAATAT CAGTCAAGCT AATCTATCAT TACTTAATAA ATAAAAGTAC AGAAAGCCAA 
TGTAGTCTTT TTGAAAAACA AGTAAATAGT TTTATACGTC AATTAATTTG GCGAGAGTTT 
TCTTATTATT TGCTATATCA TTATCCGTTT ACAGCATATA AACCTCTTAA TAAGAGCTTT 
GAACATTTTC CGTGGAATAA TGAAGAGGAG TTATTAAGAG TATGGCAGAA AGGTGACACT 
GGTTATCCGT TTATTGATGC AGGAATGAGG GAACTGTGGC AAACAGGTTT TATGCATAAT 
CGCACAAGAA TGGCTGTAGC CTCTTTTCTT GTAAAGCATT TGTTAATTCC GTGGCAAGAA 
GGAGCAAAAT GGTTTATGGA TACACTATTA GATGCTGATA TTGCAAATAA TACAATGGGG 
TGGCAATGGG TTGCTGGAAG TGGAGCAGAT GCATCACCAT ACTTTCGTAT TTTTAATCCG 
ATCACACAAG GAGAAAAGTT TGATAAAAAC GGAGAGTATA TAAGAAAATG GGTACCAGAA 
TTAAAAGATA TGCCTAATAA ATATATACAT AAACCGTGGG AAGCACCTGA GCATATTTTA 
CAAAAGGCCA ATATACAGCT TGGTCATACA TATCCTTTGC CAGTCGTTGA TCATAAGGCA 
GCACGAGAGA GAGCGCTTTG TGCATATAAA AGTATGAAAG AATTCGTATG A

Protein sequence

MQNKIIVMFQ KDFRLYDNPA LFEAAQSGEV VPVYVHDETF SMGSASKWWL HHAIIDVKKQ 
LEALGSTLII RKGSTQEEIL SLVEQLGITA VYWNICYDPD RLQSNQKMKM MLEHKGMICK 
EFNSHLLLEP WVIKKKDNTE YKVFTPFYNA FQKQVIHKPI SKVQSIKGGN SLPVSLSVSE 
LHLLPTIPWT SHMESIWEPT EEGAYKTWKE FFSSKLASYS EGRDFPNQNA HSMLAPYLSF 
GQISVKLIYH YLINKSTESQ CSLFEKQVNS FIRQLIWREF SYYLLYHYPF TAYKPLNKSF 
EHFPWNNEEE LLRVWQKGDT GYPFIDAGMR ELWQTGFMHN RTRMAVASFL VKHLLIPWQE 
GAKWFMDTLL DADIANNTMG WQWVAGSGAD ASPYFRIFNP ITQGEKFDKN GEYIRKWVPE 
LKDMPNKYIH KPWEAPEHIL QKANIQLGHT YPLPVVDHKA ARERALCAYK SMKEFV