Gene Apar_1235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Apar_1235
Symbol
ID	8414114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Atopobium parvulum DSM 20469
Kingdom	Bacteria
Replicon accession	NC_013203
Strand	-
Start bp	1387367
End bp	1388671
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	45%
IMG OID	645022828
Product	histidine kinase
Protein accession	YP_003180252
Protein GI	257785035
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.14404
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTCGC TTGTTCTGCT GTTCACGGTG ACGCTGTCGG TCATCATGTT TGCTAGCACT 
CAGGAGATCA GACAGAAGAA CATGGACGTG CTCAACCGCT ACGCCAGTCA GTATTCGCTT 
GAGAAGGAAA AAGGTAGCTC TGAGGGACAG AGTGGCCCAG AGGGTCAGGG TAGTTCTGAG 
GGGCAGGGTA GCTCCGAGGG ACAGACAAGC TCCGAAGATC AGAGTCCGCA GCAGCCACTG 
GTCAAACCTG ACGCTCAGCT GTCAAACAAA TCTGACAATC AACCGCCAGG TCAGAGATCT 
GCTTACGAGC TCTCAACGTT TTACTCAGTA TCGTTTTCTG TAGACGGCTC CGTACTTTCA 
GTCTTTAATG GCGAGAAAAC CGTTAGCTCT GATGAAAACC TTACTGAGTT TGCTCGTCAG 
ATTTTGAACG AAGGAAATCC TTCTGGTAGA ACAGGCAATC TTTCTTACGT GGTTATGAAA 
AAAGATGGCT ATACGCTTGT GGCGTTTATG GATAACACCG TTTCTGAAGC CGGTCTTCAG 
ACCATGATGC GAAACGCTCT GCTTGTAGGA GGCGTATCGC TGGTAGGTAT GTTCTTTATT 
TCTGTGTTTC TGGCAAAGCG CATTATTCGT CCACTTGAAG AGAGTGATAA AAAGCAGAAG 
CAGTTCTTAT CCGACGCAAG TCACGAGCTC AAGACCCCTA TTGCGGTTAT TGACGCCAAT 
GCAGAGATTC TATCCAGAGA ACTTAGTCAC AACGAATGGC TCTCCAACAT TCAATACGAG 
AGCAATCGTA TGGGAAAGCT AGTAAAACAG CTGTTAGATT TTTCTAGTGC GGAGAATAGA 
GAAGTGCCTA TGGAAAAGCT GGACTTCTCT CATGTGGTTA CTGGAGAATC ACTGGTCTTT 
GAGACGTTTG CGTTTGAGAA TGGCAAGGTG CTTCAAAGCA ACATTGAAGA GGGGATTGTT 
CTTACAGGCA ATCAGAATCA GCTTACGCAG GTTATTTCTG TGCTGCTTGA TAACGCCCTG 
AGGCACACAA CGGGTACTCA GATTGAGTTA AATCTTAAGA AACAAGGTCA TAGCGCCATC 
TTAAGTGTTA GTAATGACGC GGAAGAGATT TCTCAAGAAA AGCTTGAGCA TCTGTTTGAT 
CGTTTTTATC GCGTTGATGA TGTACGAAAT AGTGAGGATA ATCACTATGG ACTAGGTCTT 
TCGATTGCAC AAGCTGTGGT TCAAAAGCAT GGTGGAACTA TTAATGTAGG CTATTCAGAG 
GGTCAGATTA CTTTTACTGT TCAGCTTCCT ATTAAGGGCA AATAA

Protein sequence

MVSLVLLFTV TLSVIMFAST QEIRQKNMDV LNRYASQYSL EKEKGSSEGQ SGPEGQGSSE 
GQGSSEGQTS SEDQSPQQPL VKPDAQLSNK SDNQPPGQRS AYELSTFYSV SFSVDGSVLS 
VFNGEKTVSS DENLTEFARQ ILNEGNPSGR TGNLSYVVMK KDGYTLVAFM DNTVSEAGLQ 
TMMRNALLVG GVSLVGMFFI SVFLAKRIIR PLEESDKKQK QFLSDASHEL KTPIAVIDAN 
AEILSRELSH NEWLSNIQYE SNRMGKLVKQ LLDFSSAENR EVPMEKLDFS HVVTGESLVF 
ETFAFENGKV LQSNIEEGIV LTGNQNQLTQ VISVLLDNAL RHTTGTQIEL NLKKQGHSAI 
LSVSNDAEEI SQEKLEHLFD RFYRVDDVRN SEDNHYGLGL SIAQAVVQKH GGTINVGYSE 
GQITFTVQLP IKGK