Gene Apre_0394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0394
Symbol
ID	8397168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	445579
End bp	446823
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	35%
IMG OID	644994752
Product	protein of unknown function DUF21
Protein accession	YP_003152164
Protein GI	257065908
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0591737
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACGACTA TCAATATAAT TCAGCTGATT CTCATAATTA TGGGAGTAAT GTTTTCGGCA 
TTTTTCTCCT CATCAGAAAC AGCCCTTACA AGTATTAATA CATTTAAAAT CAGACAAATG 
GAAAAAAACG GAGTTAAAAA CTCCCATATA CTTAAAAAAT TAGTAGATAA TATCACCAAG 
GTACTTACTA CCATCCTTAT TGGGAATAAT ATAGTAAATA TTGTAACGAC TACCATAGCG 
ACCATATTTT TTACAGATGT TTTCGGTCCT AAGGGTGCTG TGATTTCACC TATAATTTTA 
ACAATAGTTG TACTGATTTT TGGAGAAGTA ACTCCCAAAA ATATAGCTAC ATCAAACCCG 
GAAAGATTAT CCCTAAAGGT TGCTAAGCCT ATTAGGTTTT TAAATATAAT ACTTACTCCC 
TTATCCTTTA TCCTAGGTCT TATTACAAAT TCAATTGGAA AACTTTTTAT AAGCGATAGC 
ACGGATAATG ATAGGGTAAC AGAAGAAGAC TTAAAGACTA TAGTTGATGT GTCAGAAGAG 
CAGGGAGTAA TCAATAACGA AGAAAGTGAA ATGATAAATA ACGTCTTCGA ATTCGGTAAC 
TCCGACGTTT CAGATATCAT GACAGCAAGG ACCAATATGG AAGCTATACC AGTAGACCTT 
CCTATTGATG AACTGAAGGC CTTTCTTAAA AGCTCCAACC ATTCTAGAAT TCCAGTTTAC 
GGGAGAAATA TAGACAATGT CCTAGGAATC CTACATATGA AAGATTTAGT CAGTCATATG 
GTTCAGGAAA ATGACATAAA GTTAATCGAT TGTATAAGGC CTGCCTATTA TGTCTACGAC 
AATATGCACA TCTTTGACCT CTTTACTACT ATGAGGGGGG AGAATCTCTC CCTTGCTATT 
GTAATCGATG AATACGGCGG AACAAGCGGC CTTGTAACCA TAGAAGATAT AGTAGAAGAG 
CTTGTAGGAG AGATCGATGA CGAATATGAT TCGGCCTATG AGACAATCTA TAAGATAAAT 
GACAAGGAAT ATTTGGTCAA TCCTTCAATC CACTTAAATG ATTTCAACGA CTATTTTGAT 
ACGGATCTAG AGGAGATCAA AAACGACTCT ATAGGAGGTT TTGTGATTGA TAAGCTTTCT 
AGGATTCCTA ATAAGGGGGA TTCTATCAAA ATTAACAATA TGACTATCAC AGTCCTTCAA 
GTCGATAGAT ATAAAATCGA GATGCTCAAA GTAAATTTTA TATAA

Protein sequence

MTTINIIQLI LIIMGVMFSA FFSSSETALT SINTFKIRQM EKNGVKNSHI LKKLVDNITK 
VLTTILIGNN IVNIVTTTIA TIFFTDVFGP KGAVISPIIL TIVVLIFGEV TPKNIATSNP 
ERLSLKVAKP IRFLNIILTP LSFILGLITN SIGKLFISDS TDNDRVTEED LKTIVDVSEE 
QGVINNEESE MINNVFEFGN SDVSDIMTAR TNMEAIPVDL PIDELKAFLK SSNHSRIPVY 
GRNIDNVLGI LHMKDLVSHM VQENDIKLID CIRPAYYVYD NMHIFDLFTT MRGENLSLAI 
VIDEYGGTSG LVTIEDIVEE LVGEIDDEYD SAYETIYKIN DKEYLVNPSI HLNDFNDYFD 
TDLEEIKNDS IGGFVIDKLS RIPNKGDSIK INNMTITVLQ VDRYKIEMLK VNFI