Gene Apre_1256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1256
Symbol
ID	8398045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1348646
End bp	1350121
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	40%
IMG OID	644995601
Product	transcriptional regulator, XRE family
Protein accession	YP_003153001
Protein GI	257066745
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAT TATCTATAGA GAAATTGGCA GATACTGTCA TTAACAAGAG AAAAGAAAAA 
GGAATAACTC AAAAAAGTCT TGCTGATACT ACTGGTATCA ACAGGGCTAT GATCAGTCGT 
TTGGAATCAT GCGACTACAC ACCTTCTATC GACCAGCTAC AAGCTATAGG AGAAGTCTTG 
GACTTTGAAG TAGTTGATAT GTTTGAGGAA GAAACTTACG AAAAAGAAAT TAAATCAGAC 
AAAAAATACA AGATAGCTGT TGCAGGAACT GGATATGTAG GTATGTCCAT TGCGACCCTC 
CTATCCCAAC ATAATGAGGT TACTGCAGTT GATATTGTAG AAGAAAAGGT AGAGAAGATT 
AATAATAAGA TCTCTCCTAT CCAGGATGAT TATATAGAAA AATATCTCGA AGAAAAGGAC 
CTAAATTTAA GAGCAACCAT AGATGGAGAG GCTGCCTACA AGGATGCTGA CTTTGTAGTA 
ATCGCAGCTC CTACCAACTA CGATAGCAAG AAGAACTTTT TCGATTGCTC TGCTGTAGAA 
GATGTAATCG AGCTTGTCCT TAAGGTCAAT CCAGAAGCTA CTATGATTAT CAAATCCACT 
ATCCCAGTTG GTTACACTAG AGAAATTAGG GAAAGATATG AGACAGATAA GATTATCTTT 
AGCCCAGAAT TCCTTCGTGA ATCCAAGGCT CTTTACGACA ATCTCTACCC TTCAAGAATC 
ATTGTATCAT GCGATGATCA AAGTAGGGAT AAGGCAGAAA TATTTGCAAA TCTCCTTAAA 
GAAGGCGCCA TCAAAAAGGA CATCCCTACC CTCTTTATGG GTTTTACAGA GGCAGAAGCA 
GTCAAGCTTT TCGCAAACAC CTACCTCGCC CTTCGTGTAT CCTACTTCAA CGAACTTGAT 
ACCTACGCAG AAAGCAAGGG ACTAAATACA GAAGAGATCA TCAACGGAGT ATGCCTAGAT 
CCAAGAATAG GCACCCACTA CAACAACCCT TCCTTTGGCT ATGGTGGATA CTGCCTGCCA 
AAAGATACCA AACAACTTCT AGCAAACTTC GACAAGGTCC CACAAAACAT GATCTCCGCA 
ATCGTAGACT CCAATAGGAC CAGAAAGGAC TTCATAGCAG ATCAAGTCCT AAACATAGCA 
GGCTACTACG ATTACAATTC AGACGACCAG TATCAACCAG AAATGGAAAA AGACTGTGTA 
ATAGGAGTCT ACAGACTCAC CATGAAGTCA AACTCAGACA ACTTCCGCCA ATCCTCTATC 
CAAGGAGTTA TGAAAAGAAT CAAGGCCAAG GGAGCAAAGG TAATAATCTA CGAACCAACC 
CTAGAAGACG GTGACACCTT CTTTGGATCT TTAGTAGTAA ACAACCTAAA CAAATTCAAA 
AAAATGAGCC AGGCAATAAT AGCCAACAGG TACGACGAGA GCCTAGACGA TGTGATGGAG 
AAGGTATACA CGAGGGATAT ATTTAAGAGA GACTAG

Protein sequence

MKKLSIEKLA DTVINKRKEK GITQKSLADT TGINRAMISR LESCDYTPSI DQLQAIGEVL 
DFEVVDMFEE ETYEKEIKSD KKYKIAVAGT GYVGMSIATL LSQHNEVTAV DIVEEKVEKI 
NNKISPIQDD YIEKYLEEKD LNLRATIDGE AAYKDADFVV IAAPTNYDSK KNFFDCSAVE 
DVIELVLKVN PEATMIIKST IPVGYTREIR ERYETDKIIF SPEFLRESKA LYDNLYPSRI 
IVSCDDQSRD KAEIFANLLK EGAIKKDIPT LFMGFTEAEA VKLFANTYLA LRVSYFNELD 
TYAESKGLNT EEIINGVCLD PRIGTHYNNP SFGYGGYCLP KDTKQLLANF DKVPQNMISA 
IVDSNRTRKD FIADQVLNIA GYYDYNSDDQ YQPEMEKDCV IGVYRLTMKS NSDNFRQSSI 
QGVMKRIKAK GAKVIIYEPT LEDGDTFFGS LVVNNLNKFK KMSQAIIANR YDESLDDVME 
KVYTRDIFKR D