Gene Apre_0087 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apre_0087
Symbol
ID	8396838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerococcus prevotii DSM 20548
Kingdom	Bacteria
Replicon accession	NC_013171
Strand	+
Start bp	107793
End bp	108902
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	35%
IMG OID	644994426
Product	histidine kinase
Protein accession	YP_003151861
Protein GI	257065605
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00115186
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AGAAATCCTA CGACTCTATA GTAACAAGGC TAATAATTTC CATTGTAATT 
ATATTTGTCC TAATGGTTCT CGTTTCGAAT TTTCTTATAA ATAGGAAACA AATTATGATA 
ATGGAGGAGG TCTTTGAGGG CTTTTCTAGA AACTTTCCAG AAAATAACGA GTCGGTAGTC 
CTTCTTATAG ATAGTGCCCA GGTCCAATCC ACAAGTGCTT TTAGGCTGTA TCTCGGCTTG 
GTTGTAGCTT CAGTCGTTCT GATTGGATCT TTGACCTTTG TCTTTATAAT CAAAAGGACC 
CTAAAACCCC TAAACAAACT AGAAGAGAAG ATAGGAAGGG TGGATATAGA AAATCCCGAT 
AGTTTCTCGG AAAATCTAGT CTTGGTTGAG GGGCCTACGG AGATCAAGGA GCTTTCCAAG 
AAGTTTGATG ATTTAATCCA AAGGATTTAT AAGGATTACA AGAAGCAAAA GGAATTCTCA 
TCAAATGTGG CCCATGAGCT AAGGACACCC ATAGCTATAA TGCAGGCCCA GGTCGATGTT 
TTTAGAGAGA AGAATACTGA CGAAAATAAT CTAGACTTTA TTGAAACAAT GGATTCCAAT 
CTTAAGAGGC TCAAAAATCT TATCGATTCG GTCCTTCTTT TAAGTAAGAG AAATAAATTA 
AAGATTAGCT CTGTTAATCT TGATAATATG ATAGATGAGA TTTTGTTTGA CCTAGATGAT 
TTTGCCTCTA AGAAAAATAT TAGCCTAGAC TATCACTATT CTAATATAAG CATTGATTCG 
GATGATGTCC TAATCCAAAG GCTTATCTTT AATATAGTAG AAAATGCCAT CAAATATACC 
GAAGAGGGAG GCTTAGTTGA TGTTAATGTG AGTCAAAATG ATAAGGAGAC TGTAATAAGA 
ATATCCGATA CTGGAATTGG GATTAGTGAT GAGAAAAAGG AGGCAATATT TGATCTTTTC 
TATCAAGTAG ATGACTCAAG AAACAAAGAA GGCTTTGGTA TAGGCCTTTC TCTATCTAAA 
GATATAGCCG AAACTTTGGG GGCGAGGATA GAAGTAAGAG ACAATAAGCC TAAGGGAACA 
ATATTTTTGA TAAAATTTAG AAATATTTAA

Protein sequence

MKNKKSYDSI VTRLIISIVI IFVLMVLVSN FLINRKQIMI MEEVFEGFSR NFPENNESVV 
LLIDSAQVQS TSAFRLYLGL VVASVVLIGS LTFVFIIKRT LKPLNKLEEK IGRVDIENPD 
SFSENLVLVE GPTEIKELSK KFDDLIQRIY KDYKKQKEFS SNVAHELRTP IAIMQAQVDV 
FREKNTDENN LDFIETMDSN LKRLKNLIDS VLLLSKRNKL KISSVNLDNM IDEILFDLDD 
FASKKNISLD YHYSNISIDS DDVLIQRLIF NIVENAIKYT EEGGLVDVNV SQNDKETVIR 
ISDTGIGISD EKKEAIFDLF YQVDDSRNKE GFGIGLSLSK DIAETLGARI EVRDNKPKGT 
IFLIKFRNI