Gene Arth_2940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2940
Symbol
ID	4444462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3308412
End bp	3309422
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	62%
IMG OID	639690763
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_832419
Protein GI	116671486
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCATTG CACAGCGCCC CACCCTCTCT GAAGAGGTCG TCTCCGAAAA CCGCTCCCGT 
TTCATCATTG AACCGCTGGA GCCGGGCTTT GGATACACTC TCGGAAACTC CCTCCGCCGT 
ACCCTGCTCT CCTCCATCCC GGGCGCTGCT GTTACCAGCA TCCGGATCGA TGGCGTGCTG 
CACGAGTTCA CCACGGTTCC GGGTGTCAAG GAAGATGTCA CTGAGATCAT CCTGAACATC 
AAGAACCTGT CGGTTTCCTC CGAGCACGAC GAGCCGGTTG TTGCTTACCT GCGCAAGCAG 
GGCCCGGGAG TCGTCACCGC CGCGGACATC GCTCCGCCGG CCGGCGTCGA ATTCCACAAC 
CCGGATCTGC ACATTGCCAC GCTGAACTCG AAGGGCAAGT TCGAACTCGA ACTGACCATC 
GAGCGCGGCC GCGGCTACGT TTCGGCAGCT CAGAACAAGT CCGGCGACTC CGAGATCGGC 
CGCATTCCGG TCGACTCGAT CTACTCGCCG GTGCTGAAGG TTACTTTCCG CGTGGAAGCC 
ACCCGTGTTG AGCAGCGCAC TGACTTCGAC AAGCTGATTG TCGACGTCGA GACCAAGCAG 
GCAATCGCCC CGCGCGATGC CGTCGCTTCG GCAGGCACCA CCCTGGTGGA GCTGTTCGGT 
CTGGCCCGCG AGCTGAACAC CGCAGCTGAA GGTATCGAGA TTGGCCCGTC GCCGACTGAC 
GCTGCCCTGG CAGCTGACAT GGCCCTGCCG ATCGAGGATC TGGACCTCAC CGTCCGTTCC 
TACAACTGCC TCAAGCGTGA GGGCATCCAC ACCGTGGGTG AACTCGTTGC CCGCTCCGAG 
GCCGACCTGA TGGACATCCG TAACTTCGGT GCGAAGTCCA TCGACGAGGT CAAGGCCAAG 
CTGGTTGAAC TGGGCCTGTC CCTCAAGGAC TCGCCTCCCG GTTTCGACCT GGCAGCACGC 
GCCGCAGCCA TCGAAGAGGA CGACGCCGCG TTCAGCGACG ACGAGCTCTA A

Protein sequence

MLIAQRPTLS EEVVSENRSR FIIEPLEPGF GYTLGNSLRR TLLSSIPGAA VTSIRIDGVL 
HEFTTVPGVK EDVTEIILNI KNLSVSSEHD EPVVAYLRKQ GPGVVTAADI APPAGVEFHN 
PDLHIATLNS KGKFELELTI ERGRGYVSAA QNKSGDSEIG RIPVDSIYSP VLKVTFRVEA 
TRVEQRTDFD KLIVDVETKQ AIAPRDAVAS AGTTLVELFG LARELNTAAE GIEIGPSPTD 
AALAADMALP IEDLDLTVRS YNCLKREGIH TVGELVARSE ADLMDIRNFG AKSIDEVKAK 
LVELGLSLKD SPPGFDLAAR AAAIEEDDAA FSDDEL