Gene Avin_45390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_45390
Symbol	hslU
ID	7763407
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	+
Start bp	4608407
End bp	4609747
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	65%
IMG OID	643807387
Product	ATP-dependent protease ATP-binding subunit HslU
Protein accession	YP_002801628
Protein GI	226946555
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1220] ATP-dependent protease HslVU (ClpYQ), ATPase subunit
TIGRFAM ID	[TIGR00390] ATP-dependent protease HslVU, ATPase subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCATGA CGCCCCGCGA AATCGTCCAC GAACTCAACC GCCACATCGT CGGCCAGGAA 
GATGCCAAGC GCGCCGTCGC CATCGCCCTG CGCAACCGCT GGCGGCGCAT GCAACTGCCG 
GCCGAGCTGC GCGCCGAGGT CACGCCGAAG AACATCCTGA TGATCGGCCC GACCGGCGTC 
GGCAAGACCG AGATCGCCCG CCGCCTGGCA CGCTTGGCGA ACGCCCCGTT CATCAAGGTA 
GAGGCGACCA AGTTCACCGA GGTGGGCTAT GTCGGCCGTG ACGTGGAATC CATCATCCGC 
GACCTGGCCG ACGCGGCGGT GAAGATGATG CGCGAGCAGG AGATCCAGCG GGTGCGCCAC 
CGCGCCGAGG ACGCCGCCGA GGACCGCATC CTCGACGCCC TGCTGCCGCC GGCGCGTCAG 
GGCTTCGGCG ACGAACCGAT CGCCCGCGAG GACTCGAACA CCCGCCAGTT GTTCCGCAAG 
CGCCTGCGCG AGGGCCAGTT GGACGACAAG GAAATCGACA TCGAGATCAC CGAAACGCCC 
AGCGGCGTGG AGATCATGGC TCCACCCGGC ATGGAGGAAA TGACCAGCCA GTTGCAGAAC 
CTGTTCTCCA GCATGGGCAA GGGCCGCAAG AAGACCCACA AGCTGAAGGT CAAGGATGCG 
CTCAAACTGG TCCGCGACGA GGAAGCCGCC CGCCTGGTCA ACGAGGAGGA ACTGAAGGCC 
CGTGCCCTGG AATCGGTCGA GCAGAACGGC ATCGTCTTCA TCGACGAGAT CGACAAGGTG 
GCCAAGCGTG CCAACGTCGG CGGCGCCGAC GTCTCTCGCG AGGGCGTGCA GCGCGACCTG 
CTACCGCTGA TCGAGGGCTG CACGGTGAAC ACCAAGCTGG GCATGGTCAA GACCGACCAC 
ATCCTGTTCA TCGCCTCTGG CGCCTTCCAT CTCGCCAAGC CCAGCGATCT GGTGCCGGAA 
CTGCAGGGCC GCCTGCCGAT CCGCGTCGAA CTCAAGGCGT TGACGCCCGA GGACTTCGAA 
CGCATCCTCA CCGAACCCCA CGCCTCGCTG ACCGAACAGT ACCGCGAGCT GCTGAAGACC 
GAAGGACTGA ACATCCAGTT CGCCGCCGAC GGCATCAAGC GCATCGCCGA AATCGCCTGG 
CAGGTCAACG AGAAGACCGA GAACATCGGC GCCCGCCGCC TGCACACCCT GCTCGAGCGC 
CTGCTGGAGG AAGTCTCGTT CAGCGCCGGC GACCTGGCCG CCGACCACAG CGGCCAGCCG 
ATCGTGATCG ACGCCGCCTA CGTCAACAAC CACCTCGGCG AACTGGCCCA GGACGAGGAT 
CTGTCGCGCT ACATTTTGTA G

Protein sequence

MSMTPREIVH ELNRHIVGQE DAKRAVAIAL RNRWRRMQLP AELRAEVTPK NILMIGPTGV 
GKTEIARRLA RLANAPFIKV EATKFTEVGY VGRDVESIIR DLADAAVKMM REQEIQRVRH 
RAEDAAEDRI LDALLPPARQ GFGDEPIARE DSNTRQLFRK RLREGQLDDK EIDIEITETP 
SGVEIMAPPG MEEMTSQLQN LFSSMGKGRK KTHKLKVKDA LKLVRDEEAA RLVNEEELKA 
RALESVEQNG IVFIDEIDKV AKRANVGGAD VSREGVQRDL LPLIEGCTVN TKLGMVKTDH 
ILFIASGAFH LAKPSDLVPE LQGRLPIRVE LKALTPEDFE RILTEPHASL TEQYRELLKT 
EGLNIQFAAD GIKRIAEIAW QVNEKTENIG ARRLHTLLER LLEEVSFSAG DLAADHSGQP 
IVIDAAYVNN HLGELAQDED LSRYIL