Gene Gmet_0653 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_0653
Symbol
ID	3738302
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	+
Start bp	713367
End bp	714389
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	49%
IMG OID	637777931
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_383620
Protein GI	78221873
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.00000970006
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTACAGAA ACTGGCGTGA CCTGATCAGC CCCAAGAAGC TTCAGGTTGA GAGTGAATCG 
CTTACCAATA CATACGGAAA ATTTTTTGCT GAGCCCTTCG AACGTGGATT TGGAACGACA 
CTCGGAAACT CGCTGCGAAG AGTGCTTCTT TCATCACTTC AGGGTGCCGC GATTTCTTCC 
GTGAAAATTA AGGGAGTGCT CCACGAGTTT TCATCCATCC CCGGTGTGAC TGAGGATGTT 
ACGAATATCA TACTCAATCT CAAAGGTGTC AGCCTCAAGA TGCACGGAAA TGAGGCCCGC 
ACAGTACGTA TTATTCACAA AGGTGACGGG ATTGTTAAGG CAGGCGATAT TGTCACCGAT 
GCAAATGTTG AAATTCTGAA CCCAGACCAC CATATTGCCA CCTGTTCGAA GGATGCCAAT 
CTGGAGATGG AGATGGTGGT AAAGCTGGGC AAGGGGTATG TGCCTTCGGA TCGTAACCGT 
GATGAGAAGG CTCCGGTTGG AACGATGCCG ATCGATGCCA TATTCTCTCC CATCAAGAAA 
GTGAATTTCA CTGTCTCAAA TGCTCGTGTA GGTCAAATGA CCGACTATGA CAAGCTGACT 
CTTGAAGTCT GGACGAACGG CAGTGTTGTT CCGGAAGATG CTGTTGCGTT TGCTGCAAAG 
ATTCTTAAGG AGCAACTGAG CATTTTTATC AACTTCGATG AAGAAGCCGA ACCTGCTGAG 
GAAGCGGAAA CCGAGGAGGA GCGTGAACGG GTTAACGAGA ACCTTTATCG CTCCGTAGAC 
GAGCTCGAAC TGTCCGTACG CTCGGCAAAC TGCCTCAAAA ATGCCGGTAT CAAGATGATT 
GGCGAACTTG TTTCGCGTTC CGAGGCTGAG ATGCTCAAGA CACAAAACTT CGGGCGCAAA 
TCCCTGAACG AGATCAAGGA TATTCTCGCA GATATGGGAC TTACTCTCGG GATGAAGCTG 
GATGGCTTCC CTGACCCTGA GGTTATGCGT AGGATCCGTG GGGAGCGGAA GGACGAAGAA 
TAA

Protein sequence

MYRNWRDLIS PKKLQVESES LTNTYGKFFA EPFERGFGTT LGNSLRRVLL SSLQGAAISS 
VKIKGVLHEF SSIPGVTEDV TNIILNLKGV SLKMHGNEAR TVRIIHKGDG IVKAGDIVTD 
ANVEILNPDH HIATCSKDAN LEMEMVVKLG KGYVPSDRNR DEKAPVGTMP IDAIFSPIKK 
VNFTVSNARV GQMTDYDKLT LEVWTNGSVV PEDAVAFAAK ILKEQLSIFI NFDEEAEPAE 
EAETEEERER VNENLYRSVD ELELSVRSAN CLKNAGIKMI GELVSRSEAE MLKTQNFGRK 
SLNEIKDILA DMGLTLGMKL DGFPDPEVMR RIRGERKDEE