Gene Apre_1112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1112
Symbol
ID	8397899
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	-
Start bp	1194681
End bp	1195940
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	40%
IMG OID	644995459
Product	Amidohydrolase 3
Protein accession	YP_003152860
Protein GI	257066604
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00316686
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAA AATTTATCAA TGCAAAGATT TATGGTTATG AAGATGCGAG AGAAATTCTC 
GTAGAAGATG GTTGTTTTAA GGAATTTGGC AATAAGCTAG AGGCTTGTGA TGAAGTAATC 
GATCTAGATG GAAGGCTTGT AATCCCACCT TATGTAGATA GTCACCTTCA TCTTGATTAT 
TATATGATTG GCAAGACCGA TGAGGTAAAG AATGAATCGG GAACTCTTTT TGAGGCGATT 
GACCTATGGA ATGACTTCAA GAAGGGCTCA AGCAAGGAAG AGATGAAGGA AAGAATCTAT 
GGGGCTGTAG AAGAATGTCT ATCCCACGGA ACTCAATATA TCAGAGCCCA AACCGATTGT 
ACAGATCCTA ATCTTACAGG AATTAAAGCA GCCCTTGAGG TTCGTGATGA ATTGAAGGAT 
AAGGTCACAA TCCAAGTCGT AGCCTTCCCA CAAAATGGTA TGTATTCATA TGAGGAAGAA 
GGAAAGACAG GTAGAGATCT TGTAGAAGAA GCCCTAAAGC TTGGTTGTGA AGTAGTCGGA 
GGCATCCCTC ACAACGAATG GTCAAGGGAT TTAGGAGAAA AATCCATCAA AGAAATCGTA 
AGGCTTGCCG TAAAATACGA TAGGCTAATA GATGTACACT GTGACGAGAC AGATGACGTG 
ATGGCAAGAT TTGTCGAAGT ACTCAATGCG GAGGCTATGA TAAATAAAAT AGGGGAAAAG 
ACTACAGCAA GCCATACCTG CTCTTTTGGG TCTGCGGATG ATTCCTATGC CTTTAGGATG 
ATGGGCTTAT TTAGAAAATC TAAGCTTAAC TTCATAGCCC TTCCTACAGA AAACGCATTT 
TTGCAAGGTA GACAAGACTC TTATCCAAAA CGTAGGGGAC TTACCAGAGT TTTGGAATTT 
GTAGATAATG GAATCAATGT TTGCTTTGCC CAAGACTCCA TAGTAGACTT ATGGTATCCT 
GCTGGCAACG GTAATCTCAT TAATATCCTA GACAATGGAA TTCACCTAAG CCAACTTATG 
AGAGAAAAGG ACTTCGAAAA AGACTTCGAT CTTGTTACCT ACAATGGGGC AAGGACCATG 
CACATAGAAG ACGATTACGG TTTTGATCCA GGAAAGCCTG CCAACTTTAT AGTTTTGGAT 
GCAGAAAATG AATTTGAAGC TATAAGAAAC AGGGCCGAGT GTTTGGCATC AGTACGTGAG 
GGAGAATTCC TATTCAAAAA GGCCAAAAGA GAATATGATG TGAAACTAAA TATAAGATAA

Protein sequence

MKKKFINAKI YGYEDAREIL VEDGCFKEFG NKLEACDEVI DLDGRLVIPP YVDSHLHLDY 
YMIGKTDEVK NESGTLFEAI DLWNDFKKGS SKEEMKERIY GAVEECLSHG TQYIRAQTDC 
TDPNLTGIKA ALEVRDELKD KVTIQVVAFP QNGMYSYEEE GKTGRDLVEE ALKLGCEVVG 
GIPHNEWSRD LGEKSIKEIV RLAVKYDRLI DVHCDETDDV MARFVEVLNA EAMINKIGEK 
TTASHTCSFG SADDSYAFRM MGLFRKSKLN FIALPTENAF LQGRQDSYPK RRGLTRVLEF 
VDNGINVCFA QDSIVDLWYP AGNGNLINIL DNGIHLSQLM REKDFEKDFD LVTYNGARTM 
HIEDDYGFDP GKPANFIVLD AENEFEAIRN RAECLASVRE GEFLFKKAKR EYDVKLNIR