Gene Acel_1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1030
Symbol
ID	4484571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1137274
End bp	1138857
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	71%
IMG OID	639729805
Product	TraR/DksA family transcriptional regulator
Protein accession	YP_872789
Protein GI	117928238
COG category	[T] Signal transduction mechanisms
COG ID	[COG1734] DnaK suppressor protein
TIGRFAM ID	[TIGR02420] RNA polymerase-binding protein DksA

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00152227
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0090317
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGGCGAT CGCAGGGACC ACGCGGTGGC GGGACGTCGT CGTGCCGCGT ACGCTGCGGG 
CAGCAGCGAC GATTCAGGCT CCGGAGTCTG GTGATTCGAT CTCCGGCGTG CCGCGTTGCT 
GCGCGCAGCG GAACCGACGT ATCCTCTGCT GACCTGCGTG ACGATCAGGA ATCAGAGAGG 
TTCGAGGGGG CCTCGATGGC AGGACAACGG CGTACGACGA CGGCGCCCGC CAGCCGGCGC 
ACTACCACCA CGGGGACGCG CACCGGGGTC AAGCGCACCA CCGCCGGTGG CGCGAAGCGG 
AGCGTGTCGG CGAACGCTTC GGTGGCGGGT CGGAAGGCCA CGACACAGGC GACCGCGAAA 
AGGGCCGCGG GGAAGGCCAC CGCGGCGAAG CGCGCCGCGG CGGCGAAGGC CACGGTGACG 
AAGACCGCGG CGGTGAAGGC CGCCACGAAG AAGGCCACGG CTGTGAAGAC CGCGGCGACG 
AAGACCGCGG CGGTGAAGGC CGCGGCGAAG AAGGCCGCGG CAAAGAAGGC CGCGACGAAG 
AAAGCCGCGG CAAAGAAGGC CGCGACGACG AAGACGTCTG CGGTGAAGAC CTCGGTAGCA 
ACCAAGGCGT CTGCCGGGGC GAGAGCAGCT GCCCGGGCGT CGGCACCGGC CAAGGCCGCG 
ACGACCGCGG CCAAGAAGGC CGCGACGAAA AGGGCTACGG CGCCGGCTAA GCCCGCGGCG 
AAGAAGGCTG CGGCGCCCGC GAAGACCCCG GCGAAGCAGG CGGCTGCTTC CAAGAAGGCG 
GCGGCCACGG CGGCGAAGGC ACCGGCGAAA GTGACCGCTC CCCGGAAGGC CGCAACAGCT 
GCCCAGCGGG GCGGAGCGGC AGCCAAGGCG CCGGCGAAGG CCGCGCGGAA GGCACCGGCT 
CCACCCACGA GCGTGCCACC GGCAACCGTC ACCTCGCCGT CCGGCCCGAC GCCAGCCGAG 
ACCGCCGTTC GCCATGAGGC GGAGGTGCCT GGCGGCGTGC TCTCGTCACC GGCAGCGGCC 
CAGCCCGCGG AACCAGCCGG TGCGGAGTCG TCCGCGTCTG CCGTCGAACC GCCGGCTGCC 
GAACCGCCGG TCACGGCACC GTCCGCCGGC GTCGACGCCG CAGCAGCTCC GGCCGAGTCG 
GAGACCCCCG CCAACTCGAC AGCCACGGCG CTCCCATCCG GAGCCGGCGA CGTCGGAGCC 
GGCGAGATCG CGGATGAGTA CACCTGGACA GCGGCTGAGC TCGACGAGAT TCGTGCGCAG 
CTCGAAGCGG AGATTGTCCG GTTGCGCCGG GAGATCGAAG TCGCGGAGTC GGGGCTCGCG 
GAGCGGATGC GGGACGGCGG CGACGGCGCT GGTGACGACC AGGCGGACGC CGGCACGAAG 
ACGTTCGAGC GGGAGCACGA GATGTCCCTG GCCAATAACG CCCGGGATCT GCTCGTGCAG 
ACCGAGCACG CACTCGCCCG CATCGCAGAT GGCACGTACG GCCGTTGCGA GAACTGCGGC 
AATCCCATCA ACAAGCTCCG GCTGCAGGCG AATCCGCGTG CGACGCTATG TGTGTCCTGC 
AAGCAACGGG AGGAGCGTCG CTGA

Protein sequence

MRRSQGPRGG GTSSCRVRCG QQRRFRLRSL VIRSPACRVA ARSGTDVSSA DLRDDQESER 
FEGASMAGQR RTTTAPASRR TTTTGTRTGV KRTTAGGAKR SVSANASVAG RKATTQATAK 
RAAGKATAAK RAAAAKATVT KTAAVKAATK KATAVKTAAT KTAAVKAAAK KAAAKKAATK 
KAAAKKAATT KTSAVKTSVA TKASAGARAA ARASAPAKAA TTAAKKAATK RATAPAKPAA 
KKAAAPAKTP AKQAAASKKA AATAAKAPAK VTAPRKAATA AQRGGAAAKA PAKAARKAPA 
PPTSVPPATV TSPSGPTPAE TAVRHEAEVP GGVLSSPAAA QPAEPAGAES SASAVEPPAA 
EPPVTAPSAG VDAAAAPAES ETPANSTATA LPSGAGDVGA GEIADEYTWT AAELDEIRAQ 
LEAEIVRLRR EIEVAESGLA ERMRDGGDGA GDDQADAGTK TFEREHEMSL ANNARDLLVQ 
TEHALARIAD GTYGRCENCG NPINKLRLQA NPRATLCVSC KQREERR