Gene Apar_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1045
Symbol
ID	8413918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	+
Start bp	1181195
End bp	1182568
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	43%
IMG OID	645022634
Product	histidine kinase
Protein accession	YP_003180064
Protein GI	257784847
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCAG AGAAATCTAA TAAAGCAACT CCACAAGAGT ATAAAAAACC CTTCTTTGCT 
CACTCCGATT CCTCAACTGC AGGTGTTATT ACCTGGGGAT TTTGGTGGCG TAAGCTAATA 
AATTACATTG GCTTCAATTT CTTTCTATTA GTGAATATTA CGCTTGTTTA TATTTATATG 
TATAACCAGC ACCTGCCACA GGGCACTTTT TACCTGGGAT TTTTTCCCAT CGAGTCTAAT 
TCTATTTCTC TTACTGGTTT CTCTTTCTTG CACGGACTCT CAAGCCTCAA ATACATTGTT 
CACGGAATAA CCTTTGGTGC AAAAATATTT GATTTAGGTG CGGACTTAAC TCGTTTCTGG 
CCAGCATATC TTGCTATTCT CATCTGGGAA TTTATTGACA TGCTGCATTT TTTTAGCGAT 
ATGCGCCGTG TCAGAAGAGC TCTTCAACCC CTCAATACAC TTGCTCTTAA AACAGAACAA 
TTGATTAATA GTGATGTACT AGCAACTAAC ACTACAGCCA CTAATGACAT CCTAGTTAAG 
AAGGATAAAA TGAGGAGTCT TGAACAGGCT ATTGAAGAAG CCAATGTCAA CTCTCCAAAG 
ATTCAAACAG GCGACCAAGA CCTTGCAAGT ATTGAAATTG CTTTGAATAA GCTGCTTCGC 
CGTATGCAAG AAGCAAAGTT GCAACAAATG CGCTTTGTCA ACGATGCTAG TCACGAACTC 
CGCACACCTA TAGCTGTTAT TCGAGGTTAT ACCGACATGC TAGATCGCTG GGGTAAAACA 
GACGAAGCGG TACTTGACGA ATCCATTACT GCACTCAAAT CTGAAAGTCA GCACATGCAT 
GACCTGGTTG AACAGCTCCT CTTCTTAGCA CGTGGAGACG CAGGAAGAAA TACCCTCACA 
AAGATCCAGC TCAATCTTGC GCAGATAGCT TCTGAGGTCT GGGAAGAATC GGAGATGATT 
GACCCTGACC ACCGCTATGC TCTGAAGTTT GATCAAAGTG CGCTGTCAGA TGACCACTAC 
CAAGTACTTG CCGATACTGC CATGATTAAG CAATCTATCC GTATTATCGT GCAAAACGCT 
GCAAGATATT CTGCTGCCCA AACTACCATT TCTTTTAACG TCACATATGA CGAGAAAACC 
GTTCAAGTTT CAATTGAGGA CGAGGGTATG GGTATATCGG AGGCTGCTGC TGCTCATATT 
TTTGAGAGGT TCTGGAGAGC TGACAACGCC CGCATTGAGA GCAACGAAGG TTCTGGACTT 
GGCTTATCCA TAGCAAAATG GATTGTCGAC AACCATGATG GTTCTATTAA AGTGGTTTCA 
CGCGAGGGCG TAGGCACGCG CTTTACTATC GTTCTACCAC ACAAAGTTTC ATAG

Protein sequence

MSSEKSNKAT PQEYKKPFFA HSDSSTAGVI TWGFWWRKLI NYIGFNFFLL VNITLVYIYM 
YNQHLPQGTF YLGFFPIESN SISLTGFSFL HGLSSLKYIV HGITFGAKIF DLGADLTRFW 
PAYLAILIWE FIDMLHFFSD MRRVRRALQP LNTLALKTEQ LINSDVLATN TTATNDILVK 
KDKMRSLEQA IEEANVNSPK IQTGDQDLAS IEIALNKLLR RMQEAKLQQM RFVNDASHEL 
RTPIAVIRGY TDMLDRWGKT DEAVLDESIT ALKSESQHMH DLVEQLLFLA RGDAGRNTLT 
KIQLNLAQIA SEVWEESEMI DPDHRYALKF DQSALSDDHY QVLADTAMIK QSIRIIVQNA 
ARYSAAQTTI SFNVTYDEKT VQVSIEDEGM GISEAAAAHI FERFWRADNA RIESNEGSGL 
GLSIAKWIVD NHDGSIKVVS REGVGTRFTI VLPHKVS