Gene Apre_1035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1035
Symbol
ID	8397822
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1104654
End bp	1105838
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	31%
IMG OID	644995383
Product	protein of unknown function DUF795
Protein accession	YP_003152784
Protein GI	257066528
COG category	[R] General function prediction only
COG ID	[COG1323] Predicted nucleotidyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAC TTGCAATTAT TTCTGAATTT AATCCATTTC ACAATGGACA CAAATATTTA 
ATAAACAAGG CAAAGGAAAT TACAAAAACA GACTTAGCTA TTAGCTTAAT GAGCGGTGAT 
TTCGTTCAAA GAGGTGAAGC GAGTCTTATA GATAAGTATT CTAGAGCTGA CGCTGCCTTA 
GATAATGGCT TCGACCTTGT TATAGAGATG CCTAACTTTA TATCTCTGCA ATCAGCGGAG 
TTTTTCTCCT ACAAATCCAT CGAACTTTTA AACAAATTAA AGATAGACTA TCTTGCTTTT 
GGAATAGAGA ATTTAGATAG TGAAGAATTT CTTGATATTT CAGCTAGGTT AATAAAAGAT 
AATGATAGAT TGGAAGAATT AACTAAATAT TATATTGATA AAAAATATTC ATTTACTGAA 
GCAAAGTACC TTGCTCTCAA AGACTTCCTA GGAAGAGAGG ATTTTATAAG TTCTAACAAT 
ATCCTTGCCC TCGAGTATAT GATATCAATT AGTAAAATCA ACCCAAATAT TATGGCAATT 
CCTATTAGAA GGCTTGGAGC AAATAACCAA GACCTAGATA TAAAAGATGA AAAGTATGCC 
TCATCTACAT CAATAAGAAG GAATCTTTCT GGAAATATAG AAAAACTTAT GCCTTCCTCT 
TCCTATCAAA AATTAAAATC TTTTCAAAAA AATTATGGGC TAGCCAATAA GGAGAATCTT 
TTTGAGATTT TCAAATATAA ATTTATGATT GAAGAAAGTC AAATGCAAGA TTCCTTGTGC 
TATGAGGAGG GTCTAGATAA TTATTTCAAG ACCTTGTTAA AAGATTCGCC CACCTACGAT 
GAATTTATTG AACTTGCTGT ATCAAAGCGT AATACAATGG CGAGGATTAA GAGATTAATG 
TTAAACTATA TACTAAATAA TAAAAAATCT CTTAATGATC TTGATTATAA TTTTGTTAAA 
GTTCTTGCTT TTAATGAGAA AGCTACAAAA CTTTTTAGAG ATATTAAAAA AGAATTGAAA 
ATTGTTATAA GAAAGTCTGA TATAGAAGCA TTAGACCACG ACGATCTTCT TGTGTACGAA 
AACATGCTAA GGGCAAGCAA CCTCTACTCA CTCCTAATAG ATAGACAGTT TAATACAGAC 
TTCACTAGAA AAATTTCTAT TAAAAAAACC TATGAGGCCA ATTAG

Protein sequence

MKKLAIISEF NPFHNGHKYL INKAKEITKT DLAISLMSGD FVQRGEASLI DKYSRADAAL 
DNGFDLVIEM PNFISLQSAE FFSYKSIELL NKLKIDYLAF GIENLDSEEF LDISARLIKD 
NDRLEELTKY YIDKKYSFTE AKYLALKDFL GREDFISSNN ILALEYMISI SKINPNIMAI 
PIRRLGANNQ DLDIKDEKYA SSTSIRRNLS GNIEKLMPSS SYQKLKSFQK NYGLANKENL 
FEIFKYKFMI EESQMQDSLC YEEGLDNYFK TLLKDSPTYD EFIELAVSKR NTMARIKRLM 
LNYILNNKKS LNDLDYNFVK VLAFNEKATK LFRDIKKELK IVIRKSDIEA LDHDDLLVYE 
NMLRASNLYS LLIDRQFNTD FTRKISIKKT YEAN