Gene Nham_2594 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_2594
Symbol	groEL
ID	4031785
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	+
Start bp	2850788
End bp	2852428
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	65%
IMG OID	637971049
Product	chaperonin GroEL
Protein accession	YP_577836
Protein GI	92118107
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0459] Chaperonin GroEL (HSP60 family)
TIGRFAM ID	[TIGR02348] chaperonin GroL

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCAGCCA AAGATGTCAA ATTCGGCGTC GACGCCCGCG ACAAGATGCT GCGCGGCGTG 
GACATCCTCG CCAACGCGGT GAAGGTCACG CTCGGTCCGA AGGGCCGCAA CGTCGTGCTT 
GAAAAGTCGT TCGGCGCGCC CCGCATCACC AAGGACGGCG TCACCGTCGC CAAGGAAATC 
GAACTCGAGG ACAAGTTCGA GAACATGGGC GCACAGATGG TGCGCGAAGT CGCCTCCAAG 
TCCGCGGATG CGGCCGGCGA CGGCACCACC ACCGCGACGG TTCTGGCCCA GGCCATCGTC 
CGCGAGGGCG CCAAGTCGGT CGCCGCCGGC ATGAACCCAA TGGACTTGAA GCGCGGCATC 
GACCTGGCTG TGGAAGCCGT GGTCGCCGAC CTCGTCCGGA ACTCCAAGAA GGTGACCTCG 
AACGACGAAA TCGCCCAGGT CGGCACCATC TCGGCCAACG GAGATTCCGA AATCGGCAAG 
TTCCTCGCCA ACGCCATGAA GAGGGTCGGC AACGAGGGCG TCATCACGGT TGAAGAAGCC 
AAGTCGCTCG AAACCGAACT CGACGTCGTC GAGGGCATGC AGTTCGACCG CGGCTATATC 
TCGCCCTACT TCGTCACCAA CGCCGACAAG ATGCGTGTCG AGATGGACGA CGCCTACATC 
CTGATCAACG AGAAGAAGCT CTCCTCGCTG AACGAGTTGC TGCCGCTGCT CGAGGCCGTG 
GTGCAGACCG GCAAGCCGCT GGTGATCGTC GCGGAAGACG TCGAAGGCGA AGCGCTCGCT 
ACCCTCGTCG TCAACCGGCT TCGTGGCGGC CTGAAAGTGG CCGCGGTGAA GGCGCCGGGC 
TTCGGCGATC GCCGCAAGGC CATGCTGCAG GACATCGCCA TCCTGACCGG CGGTCAAGCG 
ATCAGCGAAG ACCTCGGCAT CAAGCTTGAA AACGTCACGC TCGCCATGCT CGGCAAGGCC 
AAGAAGGTGA TGATCGACAA GGAGAACACC ACCATCGTCA ACGGCGCCGG CAAGAAGGCC 
GACATCGAGG CGCGCGTGGC CCAGATCAAG GCGCAGATCG AGGAAACAAC CTCGGACTAC 
GACCGCGAGA AGCTGCAGGA GCGTCTGGCC AAGCTCGCCG GCGGCGTCGC GGTGATCCGC 
GTCGGCGGCG CGACGGAAGT CGAAGTCAAG GAGCGCAAGG ATCGCGTCGA TGACGCGATG 
CATGCGACCC GCGCCGCGGT CGAGGAAGGC ATCGTGCCGG GCGGCGGCGT CGCCCTGCTC 
CGCGCTTCCG AGCAGCTCAA GCGCATCAAG ACCGCAAACG ACGACCAGAA GACCGGCGTC 
GAGATCGTGC GCAAGGCGCT GTCGGCGCCG GCCCGCCAGA TCGCGATCAA CGCAGGCGAA 
GACGGCAGCG TCATCGTCGG CAAGATCCTC GAGAAGGAGC AGTATTCGTA CGGCTTCGAC 
TCGCAGAGCG GCGAATATGG CAACCTCATC TCGAAGGGCA TCATCGACCC GACCAAGGTC 
GTGCGTGCCG CGATCCAGAA CGCGGCCTCG GTCGCGGCGC TGCTGATCAC CACCGAGGCG 
ATGGTCGCCG AGCTGCCGAA GAAGAACGCC GGCGGCCCCG CGATGCCTGC GGGCGGCGGC 
ATGGGCGGCA TGGATTTCTA A

Protein sequence

MSAKDVKFGV DARDKMLRGV DILANAVKVT LGPKGRNVVL EKSFGAPRIT KDGVTVAKEI 
ELEDKFENMG AQMVREVASK SADAAGDGTT TATVLAQAIV REGAKSVAAG MNPMDLKRGI 
DLAVEAVVAD LVRNSKKVTS NDEIAQVGTI SANGDSEIGK FLANAMKRVG NEGVITVEEA 
KSLETELDVV EGMQFDRGYI SPYFVTNADK MRVEMDDAYI LINEKKLSSL NELLPLLEAV 
VQTGKPLVIV AEDVEGEALA TLVVNRLRGG LKVAAVKAPG FGDRRKAMLQ DIAILTGGQA 
ISEDLGIKLE NVTLAMLGKA KKVMIDKENT TIVNGAGKKA DIEARVAQIK AQIEETTSDY 
DREKLQERLA KLAGGVAVIR VGGATEVEVK ERKDRVDDAM HATRAAVEEG IVPGGGVALL 
RASEQLKRIK TANDDQKTGV EIVRKALSAP ARQIAINAGE DGSVIVGKIL EKEQYSYGFD 
SQSGEYGNLI SKGIIDPTKV VRAAIQNAAS VAALLITTEA MVAELPKKNA GGPAMPAGGG 
MGGMDF