Gene Acid345_1389 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1389
Symbol
ID	4068924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1685170
End bp	1686822
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	59%
IMG OID	637983398
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_590465
Protein GI	94968417
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.531963
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0257718
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCTG AGATCCACGA ACGTACCTGG CTTCAGTGGC TGGTCAAGGT ACGTATCATC 
ATCATCACCT TCCTGCTTGG AATTGAACTC GCGATCACCA ACATCACGCC GAGTTCAGTT 
TCCACCAGGC TCTTCGTCAG CGTCATCGTG CTCTGGTACA CGGTGGCCGC CTTCCTTATT 
CTTCTCGCTG CCATTTGGCG CGAAACCCGC GTCCAGTCTC ATCTCCAGGT TTTCACAGAC 
CTTTTCTTCG TCACCGCGGT CATCTTCGCG ACCGGTGGCG TCGACACCTC CTTTAACTTC 
CTCTATCCGC TGGTCATCAT CATGGCCAGC GTGCTGCTCA CGCAGACCTG GACTTACATC 
ACCGCGGTCC TCTCGGCGAT CGCTTTTACG CTCGTGCTGC AATTGGGATA CTGGGGCACC 
ATCCCTTCCT ACGGCTTGCA GCACACCGAT TCGCGCAGCC TCAACATCGT CATCCTCGTC 
AACTGGTTCG CGTTCATCGC GGTCGCGTAT CTTGCCGGCC GCCTCGCTGG ACGCCTTCGC 
CAAATCGGCG TCGAACTCGC CGACAAGAGC GGTGAACTCC TTAACCTCCA GGCGCTGCAT 
ACCAACATCA TCCAGTCCAT CAGCGCGGGG CTTATCACCA CCGGCAACGA CGGACTGATT 
CACGTCGTCA ACAAAGCCGC TTCACGTTTT ACCGAGCGCG ACGAAAACGA ACTCATCGGC 
ACTTCCATCA GCGACCACTT TCTCGACCCG TTGCCGATCG TCGCTTCTGC GCCGGTGCAT 
GCCGAAATTC GCATGAAGAC ACCTACGGGG CGCCAGAAGA CTTTCAGCAT GATTGGTTCG 
GCACTGGTGG TGCCGGAGCG CGGCGCCGTC GGCTATATCT ACACCTTCGA CGATCTGACA 
GAACTGCGCC GCCTCGAACG CGAAGTGCGC CTCCGCGACC GCCTCTCTGC TGTTGGACGC 
ATGGCCGCCG GCATCGCCCA CGAAATCCGC AATCCGCTGA CCTCGATCGC CGGATCGACC 
AAGATGCTCG CCAGCATGTC GGACCTCAAC GAAGAGCAAC AGACACTCGC GAATATCGTG 
ACGCGAGAAT CCGATCGCTT GAACTCGATC ATCACCGACT TCCTCTTCTA CGCACGTGAC 
AAGAAATTCG AGCTCCGTGA GATTGACGTC ATCCCGGTGC TGAATGACAC CCTGGTACTG 
TTGCAACACC GGCCCGGCAT GAACGTCGCC ATCGAGCGCC GCTTCGAAGC CGACAAAGCT 
CTCTGCATGG CCGACGGCGA CAAGCTCAAA CAAGTCTTTT GGAACCTCAG CGACAACGCA 
TGCCGCGCCA TGCCCGACGG AGGCACGCTC ACCGTCACGG TTCGCCCCGA CCATGAAGTC 
TGGCGGGTGC ACTTCGGCGA CACTGGCCCC GGCATGACCG GACCGCAACT CGAAAAGATC 
TTCGAACCCT TTCAAACTGA GTTCTACGGC GGCACCGGCC TCGGCCTCGC CATCGTCTAT 
CAAATTGTGC AAGGCCACGA GGGCAAGATC TCGGTCCGCT CCGCGCCCGG ACGCGGCACC 
GAATTCATGC TCCAACTGAA ACGCCCTACA AAACAATCGT TGCTGGCCGA AACCGAACCC 
GTCTCCGCCG CGGCTTCAAA GGACGTCCGA TGA

Protein sequence

MRAEIHERTW LQWLVKVRII IITFLLGIEL AITNITPSSV STRLFVSVIV LWYTVAAFLI 
LLAAIWRETR VQSHLQVFTD LFFVTAVIFA TGGVDTSFNF LYPLVIIMAS VLLTQTWTYI 
TAVLSAIAFT LVLQLGYWGT IPSYGLQHTD SRSLNIVILV NWFAFIAVAY LAGRLAGRLR 
QIGVELADKS GELLNLQALH TNIIQSISAG LITTGNDGLI HVVNKAASRF TERDENELIG 
TSISDHFLDP LPIVASAPVH AEIRMKTPTG RQKTFSMIGS ALVVPERGAV GYIYTFDDLT 
ELRRLEREVR LRDRLSAVGR MAAGIAHEIR NPLTSIAGST KMLASMSDLN EEQQTLANIV 
TRESDRLNSI ITDFLFYARD KKFELREIDV IPVLNDTLVL LQHRPGMNVA IERRFEADKA 
LCMADGDKLK QVFWNLSDNA CRAMPDGGTL TVTVRPDHEV WRVHFGDTGP GMTGPQLEKI 
FEPFQTEFYG GTGLGLAIVY QIVQGHEGKI SVRSAPGRGT EFMLQLKRPT KQSLLAETEP 
VSAAASKDVR