Gene Apre_1837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1837
Symbol
ID	8368744
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013164
Strand	+
Start bp	100440
End bp	101996
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	27%
IMG OID	644984760
Product	Radical SAM domain protein
Protein accession	YP_003142411
Protein GI	256821212
COG category	[R] General function prediction only
COG ID	[COG0641] Arylsulfatase regulator (Fe-S oxidoreductase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.654863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACTTAA TAACCCTAGA AAAAGAAAAG TTAGAAAATA AGTACAAAGA GTTATGTAAG 
GAAGAATATC CAGGGAGATT AGGCAAAACA TTTAAAACAA AATATAATTT TTACTATTAT 
GATAGTGGTA CTGGTAAAGT AGCACAAATA AATAAAAATG TGTATAAAGT CTTAACTAAA 
TTTTTAGAGA GCGAAAATTT CTTGGATTTT ATAAAACTTG ATATGTCTGA ACAAGAATTT 
TGTGAGGCTA TAAGTGAAAT AAAAGATGCG ATTAATAAAG AAAGTATACT CTCAGCAACT 
AAATTTAATT GTTTGACTGG AAAAACTTAT GAACAAATTG ATGAGATAAT AGATAATAAG 
ATACAAAATG TTACCTTAGA GGTTACAGAG AAATGTAATT TAAGATGTAA ATATTGCATC 
TATAATGAAT CTCATCCTGA ATACAGAGCT TTTGGTCATA AGAATATGGA CTGGGAAGTA 
GCAAAAAAAG CTGTTGATTT TTTAAAAGCT CATTCACAAA ATTCTGATGA ACGTCATATT 
GGATTTTATG GTGGAGAACC ATTAATAAAC TATGATCTTA TAAAGAAAAC AACAGATTAT 
GCGAATAAGT TATTTGATAA AATGACTTAT TCTATGACAA CAAATGCTAC TTTAATGAAT 
GAAGAAATTG CTGATTATAT TATGAAGAAT AAATTCAATA TTATAGTAAG TTTAGATGGA 
TATAAAGAGC TTCATAACAA AAATAGATTG TTTGTTTCTG GGGAAGGAAG CTTTGAAAAT 
ACTATTAGGG GATTAAAAAT TCTATTAAAA TCAGCGGAAA AATATAATAA TAAAGAAAGT 
ATTATCTTAA ATATGGTAAT CGAAGGACCT GATTATGAAG ATCAGTATGA TAAAATACAA 
TTTTATTTAA ATGAATGCGA TTGGTTGCCT AAAAATATAA ATATATTAAC ATCTTCTATA 
GATTATGGAC CACATGAAAG TATATATACA AGACCACAAT CTTATGAAGA AAGAATGGTT 
CTAAAAGATT ATTACGATCC AATCTTATCG TGGGATAAAA AAAATAAAAT AAGGAACAAG 
GATAATACAA ATGTCCTATT TACAGATGCT GATGTAGACA AAGCTATGAT GATTATACAC 
AAAAGATTAT TATCTGAAAA ACCTGTTAAA AAATATGGGA TGAATGGTTG TTGTGTCCCT 
GGAGAAAGAC GAATATATGT AACAGTTGAC GGAAACTTCA AAATTTGTGA AAAGGTAGGG 
GATATTCCAG AGATAGGAAA TGTAGACAAA GGATTTGATA AAAAAAGAAT TAAAGAATTA 
TATTTTGATG ATTTTATTAA AGAAGCTAAC AAATATTGCA AAGACTGCTG GGCAATTAAT 
TTATGCACTC TATGCTATGT AAATTGTTAT GATAAAAATG GGATGCACTT TGATTATAGA 
CACAATTCTT GTAGAAGTGA AAGAAATTAT TTGTTAGGTA GCTTGATAAA ATATCATGAG 
ATATTGGAAG AAAATCCAGA TGTACTTGAG GAATTTAACG AAATTGAGTT TCAATAA

Protein sequence

MDLITLEKEK LENKYKELCK EEYPGRLGKT FKTKYNFYYY DSGTGKVAQI NKNVYKVLTK 
FLESENFLDF IKLDMSEQEF CEAISEIKDA INKESILSAT KFNCLTGKTY EQIDEIIDNK 
IQNVTLEVTE KCNLRCKYCI YNESHPEYRA FGHKNMDWEV AKKAVDFLKA HSQNSDERHI 
GFYGGEPLIN YDLIKKTTDY ANKLFDKMTY SMTTNATLMN EEIADYIMKN KFNIIVSLDG 
YKELHNKNRL FVSGEGSFEN TIRGLKILLK SAEKYNNKES IILNMVIEGP DYEDQYDKIQ 
FYLNECDWLP KNINILTSSI DYGPHESIYT RPQSYEERMV LKDYYDPILS WDKKNKIRNK 
DNTNVLFTDA DVDKAMMIIH KRLLSEKPVK KYGMNGCCVP GERRIYVTVD GNFKICEKVG 
DIPEIGNVDK GFDKKRIKEL YFDDFIKEAN KYCKDCWAIN LCTLCYVNCY DKNGMHFDYR 
HNSCRSERNY LLGSLIKYHE ILEENPDVLE EFNEIEFQ