Gene Apre_1231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_1231
Symbol
ID	8398020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	1314458
End bp	1315726
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	39%
IMG OID	644995576
Product	protein of unknown function DUF1063
Protein accession	YP_003152976
Protein GI	257066720
COG category	[S] Function unknown
COG ID	[COG3681] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000111726
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGACT TTAAAGAGTT AATCAAAGAA GAGCTAATAC CTGCCACAGG TTGCACTGAA 
CCAATTGCTA TAGCCTACGC ATCAGCTAAG GCAAGAGAGG TTCTAGGATC TGATCCAGAA 
AAAATTATCG CAAATCTTTC TAGCAATATC ATTAAAAACG CCAACTCTGT AACCGTCCCT 
TCCACCATGG GTAGGAAGGG AATAGAGATA TCAGTAGTTG CTGGTATATA TTTAGGGGAC 
CCTAATAGGG AACTTGAAGT CCTAGCAGAT GTTGATAAGA GTAAGCTTGA TTTCTGTGAT 
AAGATTATAG AAGAAGGGCT GGTAAGGGTA AACCTCGCTA GAGAACACGA GGGGCTTTTT 
ATCCAAATCA TCCTTGAAAA TAAAAAGTCT ACAGCAAGCG TCACTATAGC TGATAGCCAT 
ACCAATATTA TTGAAATAAA AAAGGACGGC AAGCTAATAT ATCAAAAGGA AAAGGAAGAA 
GCAGTAAAAG AGGATATTGA CTTTTCTTTC GATAAGGTTT ATGATTTTGC TAGAACTTGT 
GATTATTCTG ATATCAAGGA AATTCTCGAT AGGCAAATTT CTTTTAATGA AAAAATCGCA 
GAAGAAGGAA TCAAAAACGA CTGGGGAGCT AATATAGGAA AACTCATCCT AAATAATGAC 
CCATCAAACT ACTATGAGAA GCTCGCTGCC TTTGCTGCAG CAGGATCTGA TGCTAGGATG 
AACGGCTGTG AGCTGCCTGT AATCATTAAC TCAGGATCAG GAAATCAAGG AATTACTACC 
TCAGTCCCTG TAATCTTATA TGCCAGAGAC AATGATTTCT CAGAAGATGA GCTCTACAGG 
GCCCTTATAT TTTCTAATCT AATTGCTTTG TATATCAAAA ACAAAATAGG CAAGCTTTCT 
GCCTACTGTG GAGTAGTATC TGCCTCTGCT GCAGCTATCG CTTCCATAGC TTTTATAAAC 
AAAGAAGATA AGAAGATTGT AGAAGATACG ATTACTAACG CCCTAGCCGT AAACTCCGGA 
ATAATATGTG ACGGGGCCAA GTCCTCTTGT GCTATGAAGA TCGCTTCAAG CCTTAGAAAT 
GCGAGCCTTG CCTATATGCA GGCCAAGACA GACAATTCCT TTGAAGTAGG AGATGGCATA 
GTCAAAGAAA ATATAGACAA AACGATCGAT ACAGTTGCAA GAATTGCAAA ATACGGAATG 
AAAAAGACTG ACGAGGTCGT CTTAAGCGAG ATGATAGGCA AGGATGACTA TCTCGAAGAC 
TTTGAATAA

Protein sequence

MTDFKELIKE ELIPATGCTE PIAIAYASAK AREVLGSDPE KIIANLSSNI IKNANSVTVP 
STMGRKGIEI SVVAGIYLGD PNRELEVLAD VDKSKLDFCD KIIEEGLVRV NLAREHEGLF 
IQIILENKKS TASVTIADSH TNIIEIKKDG KLIYQKEKEE AVKEDIDFSF DKVYDFARTC 
DYSDIKEILD RQISFNEKIA EEGIKNDWGA NIGKLILNND PSNYYEKLAA FAAAGSDARM 
NGCELPVIIN SGSGNQGITT SVPVILYARD NDFSEDELYR ALIFSNLIAL YIKNKIGKLS 
AYCGVVSASA AAIASIAFIN KEDKKIVEDT ITNALAVNSG IICDGAKSSC AMKIASSLRN 
ASLAYMQAKT DNSFEVGDGI VKENIDKTID TVARIAKYGM KKTDEVVLSE MIGKDDYLED 
FE