Gene Apre_0226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0226
Symbol
ID	8397000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	258534
End bp	259631
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	35%
IMG OID	644994587
Product	hypothetical protein
Protein accession	YP_003151999
Protein GI	257065743
COG category	[R] General function prediction only
COG ID	[COG4194] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGAAA ATATGAGTAT TGCAGTATTT TACGGGATAA TTATTATTTT GATAAGTCTT 
ATCCAAGCCT TCGTCACATC CTACTCCAAG AGGGGCTATG TACTTGGAGT TAGACTAGTG 
GAAGACTTAG AAAAGGATAG GGAAGTAAGA AAGATAGTAA AAGACTATAG GACTTTGACT 
ATCCTTGTAG GATTTGCCCT AGCTTTACTT ATAGTCGGCT TAAGCTATCT TATAGAAAAT 
GAGGCCTTGC TTAATTTAGC CTATATTCTA TCAATATTTC TAACTTATAT TCCCCTAGTT 
CTTGCTAACA AGAAACTAAA AGTATTAGCA AAGGATCAAA AAGTAGATAA GAGAAAAGTT 
GTAAGTCTAG ATTATTCAAA GATAAAAATA TTTAACAAGA AGGAATTTTT TGGCATATAC 
CTAGGCCTCC TCCTTATAGT GATAATCTTT GCCATAAGAA TCCACCTAGA CTATGAAAAC 
TTTCCAGATA AATTAATTAT GCATATGAAT AGCAAGGGAG AAATTGATGG GATAGCTCAT 
AAATCTTACC TATCTATCCA ATCCCCAACT ATAGTAAGTT TCTTTATGCT AGCAGTGATG 
TTTTTTGCAA ATCTTTCCCA ACTTCTATCA AAGATGAGAA TTAGCCCAGA TATGCCAGAA 
GAGTCCTTGG ATAGGCTCTT AGAAACTAGG AGGATTTGGA CCTATTATTT TGCAACATCG 
GCAATTTTAC TTATAGTTTT ATTCCAAGTA GGAATTCCTT CCTTTATGAA AACTGGAGAC 
GACTCCTTGG TTAAGGTCTT AGGCATAATT GCTATTGGGT TTTCTATAGG AGGTAGCATT 
CTTATAGGAA AGTTTAGGTC GGTTGACGGT TCAGCCTTAA ATAAAACTGG TAGATATGGC 
TACGAAGAGG AGGATGATAA GTGGATCCTA GGTGGTCTAA TTTATTACAA TCCAGACGAT 
CCAGCAATAT TTGTAGAAAA AAGAGTAGGC GTTGGAACTA CTATGAACTT CGCCAATAAT 
TGGGTTAAGG TAATTTTCAT TGCAGTGATA CTTTTCCCAT TTGTTCTAGG ACTTGTGCTT 
AATATGTTTG AAGGATAG

Protein sequence

MNENMSIAVF YGIIIILISL IQAFVTSYSK RGYVLGVRLV EDLEKDREVR KIVKDYRTLT 
ILVGFALALL IVGLSYLIEN EALLNLAYIL SIFLTYIPLV LANKKLKVLA KDQKVDKRKV 
VSLDYSKIKI FNKKEFFGIY LGLLLIVIIF AIRIHLDYEN FPDKLIMHMN SKGEIDGIAH 
KSYLSIQSPT IVSFFMLAVM FFANLSQLLS KMRISPDMPE ESLDRLLETR RIWTYYFATS 
AILLIVLFQV GIPSFMKTGD DSLVKVLGII AIGFSIGGSI LIGKFRSVDG SALNKTGRYG 
YEEEDDKWIL GGLIYYNPDD PAIFVEKRVG VGTTMNFANN WVKVIFIAVI LFPFVLGLVL 
NMFEG