Gene Acid345_0375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0375
Symbol
ID	4069002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	422451
End bp	423935
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	62%
IMG OID	637982378
Product	periplasmic sensor signal transduction histidine kinase
Protein accession	YP_589454
Protein GI	94967406
COG category	[T] Signal transduction mechanisms
COG ID	[COG5000] Signal transduction histidine kinase involved in nitrogen fixation and metabolism regulation
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.803434
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCTCTG ACGACCCGCC GGAGCGGACC ATGGGGTTCG CCGCGGGCAG CGGCCAGCAC 
TCGGAACGCG CCAAGGCCGC GATCGCTAAC ACCCGCTCGG CGGACGAGGC CCCATCGCGA 
ACCGCCGCGC CCTTCCGCAC CAAGCGCTCG CGCATTCGCT ACGAAAGGCG CGTGCTGCTG 
CTGGCCTTCC TCGTTGCGCT GCCCAGCATG ATCGTCAGCG TCATTCTTGT TCTCATTCAG 
AAATGGACGA TTGACGCCAA AATCGCGCTG CTCGCCGGCG AGAGCATCGC GTGGCTCCTG 
CTCGTTCTCG CCCAGCATGA GCAGATTGTG CGTCCGTTGC AAACCTTGAC CAATGTGGTC 
GCCGCACTCC GCGAAGAGGA CTACTCGTTC CGTGCTCGCG GCGCCGCCAT GGACGACGCG 
CTCGGCGAAC TAGCCATCGA AGTCAATGCC CTCGCCGACG TGCTCACCAT CCAGAAGACC 
AGCGCGATCG AAGCCACCGC ACTGCTGTCG CGCATTGTCG AAGAAATTGA CGCACCGCTC 
TTTGCCTTCG ATCCCGAACA CAAACTTAAG CTCGTAAATT CCGCTGGCGA GCGCCTCCTG 
CAGCAGCCCG CCACAAAACT TCTCGGATCC ACTGCCACCG AACTAAACCT GCAAGTGGCC 
TTTGAGGCCG AAAGCGAATC GCTCGTTCCA TTGCCCTACA GCCCGAACTC GCGCTGGATG 
GTGCGCCGCA GCAGCTTCCG CCAGGATGGC GTTCCGCACA CGCTGATCGT TCTCTCTGAC 
GTTAGCCGCG CCCTCCGCGA AGAAGAGCGG AGTGCCTGGC AGAAACTCAT TCGTGTGCTC 
GGCCACGAAC TCAACAACTC GCTCGCACCC ATCAAGTCCA TCGCCGGCAG CCTGAACTCA 
CGCTTGAAGC GCACGTCCCT CAGCGACGAA GAACGCGAAG ACTTCGAAAA GGGCCTCTCC 
ATCGTCGAAG GCCGCGCCGA GTCGCTAAAC CGCTTCCTTC AGGCCTATCG CCAGTTGGCG 
ACCATGCCCC CGCCGAAGCT CAAGCTTGTC TCCATGAAGT CGCTGGTGGA ACGCGTCGCC 
GGGCTCGAAA CCCGCGTCGT CGTCGAGGTG CGTAATAATC CCGACGTTCA TTTGCAGGCC 
GATCCCGACC AGCTCGAGCA GATGATGATC AACCTGGTCA AGAACGCCGT AGAAGCCTCC 
AAAGAAATGC AGCAGCCTGA AACTCCGGAA CCGCCGGAAG TCATCGTTGG CTGGGATGCC 
GAGCCCGCGG CCATCATCCT CAAAGTCGAA GACAACGGCC CCGGCATCAT GAACCCGAGC 
AATGCCTTCG TTCCGTTCTA TACGACGAAG CAGGGAGGCA GCGGCATCGG CCTCGTTCTT 
TCACGCCAGA TCGCCGAAGC CCACGGCGGC CGCCTAGAGT TGATCAACCG CGAAGGCACC 
CGCGGCTGCA TGGCGCGCGT CACCCTCCCC CGCGGACGCG ATTAG

Protein sequence

MVSDDPPERT MGFAAGSGQH SERAKAAIAN TRSADEAPSR TAAPFRTKRS RIRYERRVLL 
LAFLVALPSM IVSVILVLIQ KWTIDAKIAL LAGESIAWLL LVLAQHEQIV RPLQTLTNVV 
AALREEDYSF RARGAAMDDA LGELAIEVNA LADVLTIQKT SAIEATALLS RIVEEIDAPL 
FAFDPEHKLK LVNSAGERLL QQPATKLLGS TATELNLQVA FEAESESLVP LPYSPNSRWM 
VRRSSFRQDG VPHTLIVLSD VSRALREEER SAWQKLIRVL GHELNNSLAP IKSIAGSLNS 
RLKRTSLSDE EREDFEKGLS IVEGRAESLN RFLQAYRQLA TMPPPKLKLV SMKSLVERVA 
GLETRVVVEV RNNPDVHLQA DPDQLEQMMI NLVKNAVEAS KEMQQPETPE PPEVIVGWDA 
EPAAIILKVE DNGPGIMNPS NAFVPFYTTK QGGSGIGLVL SRQIAEAHGG RLELINREGT 
RGCMARVTLP RGRD