Gene Anae109_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1952
Symbol
ID	5377806
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2210788
End bp	2213046
Gene Length	2259 bp
Protein Length	752 aa
Translation table	11
GC content	73%
IMG OID	640843461
Product	signal transduction histidine kinase, nitrogen specific, NtrB
Protein accession	YP_001379139
Protein GI	153004814
COG category	[T] Signal transduction mechanisms
COG ID	[COG3852] Signal transduction histidine kinase, nitrogen specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.664907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACATCC GTACCCAGGC GGCGCTCCTC GCCGCGATCG TGACGCTCGC CCTCTCGGTG 
GCCGCGCTCC TGCGCGACAA CCGCTCCCGG GTGTTCACGC TGTTCGCGGT GTTCGCGGCG 
GACCTCTTCC TGTTCTCGCT CTCGAGCTTC TTCCTCCGCT GGTCGGAGGC GTTCGGGGTG 
GGCTGGTGGG AGCGGCTCGC GGTCGCCTCC GGCGCCCTCG TCCCCGCCGC GGCGCTCGCC 
TTCTTTCTGG AGTTCCTCGG CGTGGCGCGC CGCCCCGCCC GGCGCGCCCG GAACACCATG 
CTCGCGGGCT CGCTCACCGG CATCGTGGTG GCCGCCACGC CGCTCGTGCA GGTGAAGGTC 
GCGAAGCTCC TCGTCGCCGC CTACGTCGTC GGCGGCCTCG CCGCGGTGCT CTCGACCCTG 
TGGGGCAAGA TGCACGCCTC GCAGACGCGG GTCGAGCGCG CGCGCCTGCA GTACCTCTTC 
GTCGGCGCGC TCGTCGCGGT GCTCCTGTCG ACGCTCGACA TGCTGCCGCG CCTCGGGCTG 
CCCTACCCGC CCGAGGGGCT CGGCTCGATC ACCCTCACCG TCTTCATGTT CTTCCTGTCG 
CAGACGCTGC AGCGCCACCG CCTGCTCGAT CTGCACGAGT TCCTCGGGAA GATCGTGGTC 
GTCACCGCCC TCGGGCTGGT GCTCGTCGCC ATCTACGGCG GGCTCGTGTC CTGGGTGGGC 
GACAGGCCGG AGCTCTTCTA CTTCAACACC ATCGTGGCCT CGTTCGTGAT CCTGTCGCTG 
TTCGAGCCGC TGCGGGAGCG GGTCGAGGAG TGGGTGGTGG CGACGCTGTT CCACGAGCGC 
TACGAGCTCG TGCGGAAGCT CGAGCTGCTG CGCCACCGGA CGGGGAACGT CATCGAGCCC 
GCCGGGCTCG CCGAGGTCGT CCTCGACGGG CTCGTCGAGA CGCGCCGGGT GACCCACGCC 
TCCCTGTGGC TCGTCGCCGA CGACCGGCCC GGGTACCGGC TCCTCGATTT CCGGGGCCCG 
CCGCCCGTCC CCTTCCTCGA GCCCGCGACG GCGCGCGCCC TCCTCGGCGC CTCCGCCTCG 
ACGCAGAAGG CCATCCTGCT CGAGAACATC GACCGGCGCG TGGCGGAGCT GCGCGCGCTC 
CTTCCTCCCG GCCCGGCGGA GCACGAGACC CGCGGCGGTC GCGGCGCGCC GGCGGCCGTC 
GCGGAGGAGC TGAAGCGGCT CAGCGACGCC CGGGCGGTGA TGAGCTCGAT GCGCGCCGGC 
ATCTGCATGC CGCTCCTCGC CGGCGACCGG GCGGTCGGGT TCCTCGCCTG CTGGGACGAG 
CGCGTGCCCG AGGCCTTCGC GTCGGACGAG ATCGCCGCCC TCATCGAGGT GGCCGACCGC 
TGCGCGCTCG TCATCGAGAA CTCCAAGCTC TACCAGCACA TGAAGGAGCG CGACCGCCTC 
GCCGCCCTCG GCGAGATGTC GGCCGGCCTC GCGCACGAGA TCCGCAACCC GCTCGCCGCC 
ATCAAGGGCG CCGTGCAGTT CCTGGATCCG TCGAAGCTGC CCGGCGACGA CCGCGAGTTC 
CTCGAGATCG TCATCGAGGA GGTGAACCGG CTGAACGGGG TGGTGACCCA GTTCCTCGAC 
TACTCCCGCC CGCTGAAGCC CGCGCTCGCC CCCACCGACG TGAACGACGT GCTCGAGCGG 
ACGTTCAGGC TGCTCCAGGC CGAGGTCCCC CAGTCCATCT CGGTCGAGCT GGCCCTCGCG 
GAGTGGCTCC CGCGCGTGAA CGCGGACGCG GAGCAGCTGA AGCAGGTGTT CCTGAACCTG 
GCCTTGAACG CGTTCCAGGC GATGCCCGCG GGAGGGCGCC TGGTGGTGTC GACCCGGCTC 
ACCCGCGACG AGCTCGCGTT CTGGCGGGAG GGGTCGCGCA AGGCCGACCT CGTCGAGGTG 
CGCTTCCGCG ACAGCGGCCC GGGCGTCCCG GAGGAGGCCC GCGACCGGAT CTTCGTCCCC 
TTCTACACCA CGAAGGAGAA GGGCACCGGG CTCGGCCTCG CCATCTGCCA GCGGCTCGTG 
AAGGCCCACC AGGGCACGAT CCAGGTGCGA CCCGCGCCGG CGGGCGAGGG GGCCGAGTTC 
CTCGTCTCGC TCCCGGGGCT CCGCGAGGAG CGCCCCCCGG ACGCGCCGAA GCCGCCGGTG 
GACGAGGAGG AGCGGCAGCG CGTCCGCGAG CAGCGGCGCA AGAGCGCCGA GGCACGGCTG 
CGCCGGCGGC GCAAGCGGCG CAGGAAGCAG CAGGCCTGA

Protein sequence

MDIRTQAALL AAIVTLALSV AALLRDNRSR VFTLFAVFAA DLFLFSLSSF FLRWSEAFGV 
GWWERLAVAS GALVPAAALA FFLEFLGVAR RPARRARNTM LAGSLTGIVV AATPLVQVKV 
AKLLVAAYVV GGLAAVLSTL WGKMHASQTR VERARLQYLF VGALVAVLLS TLDMLPRLGL 
PYPPEGLGSI TLTVFMFFLS QTLQRHRLLD LHEFLGKIVV VTALGLVLVA IYGGLVSWVG 
DRPELFYFNT IVASFVILSL FEPLRERVEE WVVATLFHER YELVRKLELL RHRTGNVIEP 
AGLAEVVLDG LVETRRVTHA SLWLVADDRP GYRLLDFRGP PPVPFLEPAT ARALLGASAS 
TQKAILLENI DRRVAELRAL LPPGPAEHET RGGRGAPAAV AEELKRLSDA RAVMSSMRAG 
ICMPLLAGDR AVGFLACWDE RVPEAFASDE IAALIEVADR CALVIENSKL YQHMKERDRL 
AALGEMSAGL AHEIRNPLAA IKGAVQFLDP SKLPGDDREF LEIVIEEVNR LNGVVTQFLD 
YSRPLKPALA PTDVNDVLER TFRLLQAEVP QSISVELALA EWLPRVNADA EQLKQVFLNL 
ALNAFQAMPA GGRLVVSTRL TRDELAFWRE GSRKADLVEV RFRDSGPGVP EEARDRIFVP 
FYTTKEKGTG LGLAICQRLV KAHQGTIQVR PAPAGEGAEF LVSLPGLREE RPPDAPKPPV 
DEEERQRVRE QRRKSAEARL RRRRKRRRKQ QA