Gene Avin_41030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_41030
Symbol
ID	7762987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	4138136
End bp	4139512
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	68%
IMG OID	643806961
Product	Periplasmic sensory histidine protein kinase, two-component
Protein accession	YP_002801212
Protein GI	226946139
COG category	[T] Signal transduction mechanisms
COG ID	[COG4564] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0649951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCTCA AACACAAGAT CGTCGCTCTC AGCATCCTGC CGCTGCTGCT GGCCGTGGCG 
CTCATCTGCG CCCTGGTCAT CGTGCAGAAC CAGCGGCTGG GAGAAGACCA GGCCCGGCTG 
ATCGAGAACG CCATCCTCTC CAGCAAGCGG GCCGAACTGA AGAACTACGT GGCCATGGCA 
CTGAGCGTCA TCACCCCGCT GCAGGCCGGC GCCCCGGACG ATGCCCGGAC CCGCCGGCAG 
GCGCTGGAGG CCCTGGCCAA GCTCGATTTC GGACGGGACG GCTACTTCTT CGTCTACGAC 
ATCCGGGGCC GCAACCTGAT GCATCCCCGC CAGGCCGAAC TGGTCGGCCG CGACTTGTGG 
AACCTGACCG ACCCCCACGG TCTGCCCGCC GTCCGGGCGC TGATCGAGAG CGCCACCCAT 
GGGGACGGCT TCCAGCGCTA CGCCTGGTGG AAACCCTCGA CCGGCCAGGT GACCGACAAG 
CTGGCCTACG TGGTGATGCT CGAACCCTGG GGCTGGATGC TCGGCACCGG GATTTACCTC 
GAGGACGTGG AGCGGGCGAC CCGTCAGGTC CGCGACGAGG TGGCCGGCGG CATACGCTCG 
ACCATGGTCG CCATCGCCAC CATCGCCCTG GCGGCGGTGC TGCTGGTCTT CGCCGGCGGC 
CTGACCCTGA GCGTCCGGGA ACACCGGCTG GCCGACGGCA AGCTGCAATC GCTCAACCGG 
CGCATCGTCC ACCTGCAGGA AGAGGAACGC TCGCGGGTTT CCCGGGAATT GCACGACGGC 
ATCAGCCAAT TGCTGGTGTC GATCAAGTTC CAGTTCGAAC TGGCCGGCCA TCAACTGGAA 
GCCGGCCACA GCGGTGGCCT GGCGATCCTC GGCCAGGCCA CCGAGCGCCT GGGCGGCGCC 
ATCGGCGAGA TCCGCCGCAT CTCCCACGAT CTGCGCCCCT CGCTGCTCGA TACCCTGGGG 
CTGCCGGCCG CCATCGGCCA ATTGGCGACC GAGTTCGAGC AGCGCTGCGC CCTGAGCGTC 
GTCTACCGCA ACAGCCTGCA CGACGCCCGG CTGCCCGACG AAGTGGCGGT GGCGCTGTTC 
CGCATCGTCC AGGAAGCGCT GACCAACATC GAGCGCCACG CCCGGGCCGG CAGCGTCCTC 
ATTGATCTCG AACCCTGCGT GAGCGGCGTG CAGTTGCGGG TGCGGGACGA CGGCATCGGC 
TTCGATCCGC GGACCATAGA GCGGGCGCAG GAAGGCATCG GCCTGCGCAA CATCCGCGAA 
CGGATCGAGC ACCTCGGCGG TCGCTTCAGC CTATCGTCCA GCACTGGTCA TACCGGGATC 
TGTGTAATAT TGCCCGTGCC GGCCGCCCAG GCGGCCGGCA CGTCCTTCAC CCTATAA

Protein sequence

MQLKHKIVAL SILPLLLAVA LICALVIVQN QRLGEDQARL IENAILSSKR AELKNYVAMA 
LSVITPLQAG APDDARTRRQ ALEALAKLDF GRDGYFFVYD IRGRNLMHPR QAELVGRDLW 
NLTDPHGLPA VRALIESATH GDGFQRYAWW KPSTGQVTDK LAYVVMLEPW GWMLGTGIYL 
EDVERATRQV RDEVAGGIRS TMVAIATIAL AAVLLVFAGG LTLSVREHRL ADGKLQSLNR 
RIVHLQEEER SRVSRELHDG ISQLLVSIKF QFELAGHQLE AGHSGGLAIL GQATERLGGA 
IGEIRRISHD LRPSLLDTLG LPAAIGQLAT EFEQRCALSV VYRNSLHDAR LPDEVAVALF 
RIVQEALTNI ERHARAGSVL IDLEPCVSGV QLRVRDDGIG FDPRTIERAQ EGIGLRNIRE 
RIEHLGGRFS LSSSTGHTGI CVILPVPAAQ AAGTSFTL