Gene Veis_2058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_2058
Symbol
ID	4691853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	2336437
End bp	2338344
Gene Length	1908 bp
Protein Length	635 aa
Translation table	11
GC content	60%
IMG OID	639849822
Product	RpoD family RNA polymerase sigma factor
Protein accession	YP_996826
Protein GI	121609019
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.704789
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0381419
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGATCA GCAAGGCCAA GGAACGCGCG CTGATGAAGG AGTTCGGCCT GGACGAGACC 
GTTCTGTCCG AGGAAGACCT GGCCCGGCGC CGTTCGCGCC TGAAGACCCT GATCAAACTG 
GGCAAGACGC GCGGCTACCT GACCCATGTC GAGATTTCCG ACCACTTGCC CGACAAACTG 
GTCGATGCCG AAACGCTGGA AGCCGTCATC ACCACGCTGA ACGACCTGGG CGTGGCCGTC 
TACGAGCAAA CGCCCGATGC CGAAGCGCTG ATCATTACCG ACAATGCCCC CACCGGCGCC 
AGCGAAGAAG AGGCCGAAGA GGCCGCCGAA GCGGCCCTGT CTACCGTCGA CAGCGAGTTC 
GGCCGCACCA CCGACCCGGT GCGCATGTAC ATGCGCGAGA TGGGCACCGT GGAACTGCTC 
ACGCGCGAAG GCGAGATCGA AATCGCCAAA CGCATCGAAG GCGGCCTGAT GGCGATGATG 
GAGGCGATCA GCGCGTCGCC AGCCACCATC GCCGAAATAC TGAACATGGG CGAGGAAATC 
CGCGCAGGCA AGGTCGTGAT CTCGACCATC GTCGATGGCT TTTCCAACCC CAACGAGGCC 
GACGACTACG TGGCCGAAGA AGACTTCGAC GAATTTGACG AAGCCGATGA CGACGACGGC 
AAGGGCGGCT CCAAGGCGCT GACCAAAAAG CTCGAAGAAC TCAAAAAGCA GGCCCTGGAA 
CGCTTTGACA AACTGCGCGA TCTGTTCGAG AAAATGCACA AGGTCTACGA CAAGGACGGC 
TACGGCACGC TGGCCTACGT GCAGGCCCAG CAAGCCCTGT CGGCCGAGCT GATGACCATA 
CGCTTTACCG CCAAGACCAT CGAAAAACTG TGCGACATGG TGCGCGGCCA GGTCGATGAT 
GTGCGCCGGA AAGAACGCGA GCTGCGCCGC ATCATCGTGG ACAAATGCGG CATGCCGCAG 
GAAACCTTCA TCAAGGATTT CCCGCCCAAC CTGCTGAACC TGCAATGGGT GGAAAAGCAG 
GCGGCCATGG GCAAGCCCTG GTCTTCGATC ATTGCGCGCA ACATCCCGCC GATCCAGGAT 
TTGCAGCAAA AGCTGATGGA CTTGCAGTCG CGCGTGGTGG TGCCGCTGAC CGAGCTCAAG 
GTCATCAACA AGCGCATGAA TGAAGGCGAG GCCACCTCGC GCGATGCCAA AAAGGAAATG 
ATCGAGGCCA ACCTGCGCCT GGTGATCTCG ATTGCCAAGA AGTACACCAA CCGTGGCCTG 
CAATTCCTGG ACCTGATACA GGAGGGCAAC ATCGGCCTGA TGAAGGCCGT GGACAAATTC 
GAATACCGCC GCGGCTACAA ATTCTCGACC TATGCCACCT GGTGGATCCG CCAGGCCATC 
ACGCGCTCGA TCGCCGACCA GGCGCGCACC ATCCGCATCC CGGTGCACAT GATAGAGACC 
ATCAACAAGA TGAACCGCAT CAGCCGCCAG CACTTGCAGG AGTTCGGCTT CGAGCCCGAT 
GCCTCGCTGC TGGCCGCCAA AATGGAGATA CCCGAGGACA AGATCCGCAA GATCATGAAG 
ATCGCCAAAG AACCGATCTC GATGGAAACC CCGATCGGGG ACGACGACGA CAGCCACCTG 
GGCGATTTCA TCGAGGACGC GAGCAACACC GCCCCGATAG AAGCCGCGAT GCAGGCCGGC 
CTGCGCGACG TGGTCAAGGA CATCCTCGAC GGCCTGACGC CGCGCGAAGC CAAGGTGCTG 
CGGATGCGCT TCGGCATCGA GATGACCAGC GACCACACGC TGGAAGAAGT GGGCAAGCAA 
TTTGACGTGA CGCGCGAGCG CATCCGCCAG ATAGAAGCCA AGGCGCTGCG CAAGCTCAAG 
CACCCGAGCC GTTCGGACAA GTTGCGCAGC TTCATCGACT CGATATAG

Protein sequence

MKISKAKERA LMKEFGLDET VLSEEDLARR RSRLKTLIKL GKTRGYLTHV EISDHLPDKL 
VDAETLEAVI TTLNDLGVAV YEQTPDAEAL IITDNAPTGA SEEEAEEAAE AALSTVDSEF 
GRTTDPVRMY MREMGTVELL TREGEIEIAK RIEGGLMAMM EAISASPATI AEILNMGEEI 
RAGKVVISTI VDGFSNPNEA DDYVAEEDFD EFDEADDDDG KGGSKALTKK LEELKKQALE 
RFDKLRDLFE KMHKVYDKDG YGTLAYVQAQ QALSAELMTI RFTAKTIEKL CDMVRGQVDD 
VRRKERELRR IIVDKCGMPQ ETFIKDFPPN LLNLQWVEKQ AAMGKPWSSI IARNIPPIQD 
LQQKLMDLQS RVVVPLTELK VINKRMNEGE ATSRDAKKEM IEANLRLVIS IAKKYTNRGL 
QFLDLIQEGN IGLMKAVDKF EYRRGYKFST YATWWIRQAI TRSIADQART IRIPVHMIET 
INKMNRISRQ HLQEFGFEPD ASLLAAKMEI PEDKIRKIMK IAKEPISMET PIGDDDDSHL 
GDFIEDASNT APIEAAMQAG LRDVVKDILD GLTPREAKVL RMRFGIEMTS DHTLEEVGKQ 
FDVTRERIRQ IEAKALRKLK HPSRSDKLRS FIDSI