Gene GM21_2518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2518
Symbol
ID	8137860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2946387
End bp	2947397
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	65%
IMG OID	644870127
Product	transcriptional regulator, AraC family
Protein accession	YP_003022317
Protein GI	253701128
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	0.179818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGC CAACGACCAT ATCCGACAGA GAGAGTACCG GGCGGCGCAG GATCGCGGTA 
GCGGCATACG AAGGTGCCGA GCTCTTGGAC GTCACCGGCC CCATTGAAGT CTTCAACATG 
CTGAACCGTT GCCTCGGAGA GGTAGAGGCC CTTGAGCGCG GCTACAACGT GCTCTTGATG 
GCGCAGCAGC CCGGACCCTT CGCTTCTTCG CCGGGGATAA AGCTGGTGGC GGACCTTGCC 
TGGCAGGAGC TTACAGCCGG CACGGACTCC ATCTTCGTGC CGGGAAGCCC TGATGACGCT 
CTGGCGAAGG CTCTGAAAAA CGAGCCGCTG GTGGAGTGGC TGCGCTCGAC CCCAACGCTC 
GCCAAGCGCG TGGTTTCGGT CTGTACCGGC GCCTTTCTAC TAGCCAAGGC GGGGCTCCTC 
GACGGGCGGC GCGCCACAAC CCACTGGATG GACCTGGAGC GGTTGGCCCG GGAATACCCG 
CAGGTCATGG TGGAGCAGGA CGCCATCTAC ATACGGGACG GGGAGATCGC CACCTCGGCC 
GGGGTCACCG CCGGGATGGA TCTGGCCCTG GCGCTGGTCG AGGAGGATTT CGGCCGGAAG 
ATGGCGCTCA CGGTGGCCCG GCGCCTGGTC ATGTTCCTGA AGAGGCCGGG GGGGCAGGCG 
CAGTTCAGCA CCCAGCTGCG GGCCCAGATG GTGGAAGGGG GGCAGCTCGC CACCCTGCTC 
GCATGGATTA AGGATAATCA CTGCCGCAAG GTCACGGTGG AAGAGCTGGC CGGGCGGGCG 
GCCATGAGCC CGCGCAATTT CGCCAGGGTC TTCCTGCGGG AGACGGGAAA GACTCCGGCC 
CGGTATCTAG ACCAACTGCG TCTGGAGCGC TCGATAAACC TGATGGAGGA CGGCGCGCTC 
TCCCTGGACA GGGTCGCCGC CGAGAGCGGT TTCACCTGCG CCGAACAGAT GAGGCGGGTC 
TTTATCCGCG AGATGGGGGT AACCCCTCTT GCGTACCGGA CGAGGTTTTG A

Protein sequence

MKKPTTISDR ESTGRRRIAV AAYEGAELLD VTGPIEVFNM LNRCLGEVEA LERGYNVLLM 
AQQPGPFASS PGIKLVADLA WQELTAGTDS IFVPGSPDDA LAKALKNEPL VEWLRSTPTL 
AKRVVSVCTG AFLLAKAGLL DGRRATTHWM DLERLAREYP QVMVEQDAIY IRDGEIATSA 
GVTAGMDLAL ALVEEDFGRK MALTVARRLV MFLKRPGGQA QFSTQLRAQM VEGGQLATLL 
AWIKDNHCRK VTVEELAGRA AMSPRNFARV FLRETGKTPA RYLDQLRLER SINLMEDGAL 
SLDRVAAESG FTCAEQMRRV FIREMGVTPL AYRTRF