Gene M446_5067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5067
Symbol
ID	6135292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5554152
End bp	5555156
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	79%
IMG OID	641645202
Product	AraC family transcriptional regulator
Protein accession	YP_001771827
Protein GI	170743172
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0666766
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAAGACG GACTCACGCG AAACCCGGAT CCGGGGGCGC CGCCGGGCGG CCTCGCGCCG 
GTGTGGATCC TCGCCGAGGG CGCGCCGCCG GGCGGCGGCT TCGCGCCGCC CCGCGCCGCG 
GGCCGGACCG CCCCCGTCCG CCGCGCGCCG CCCCCGGAGC TCCCGTTCGG GGCCGCGGCT 
TTGCTGCGCC TGGAGCCGGA TATCGGGCTG ATGTCCTGCT TCCGCCCGAC GCCCGAGACC 
GACCTCCCGG TGGCGAGCCC CGTCCTGCCG GGCGGCGCCG TGCTGCTGCG CCCGCACGGC 
GGCGCCGTCC GGGCGCGGGT GGGGGGGACC CACGTCCTCG TCGAGGACGG CGAGGCGATC 
CTGCTTGCGG GGCCGGCGAG CCTGCGCGTC GCGGATGCGG GGCGCCTCGA CGCGCTCGCG 
CTGCCCGCGC GCGCCGTCAC GCCCGCCATG GCGGAGGTGG CCGCCTCCCT CCGGGTCTTC 
CCTCGGGACA GCGCGGCCTT GGCCCTGCTG CACCATTACG GCGCGGCCCT GATGCGGGGG 
CTGCTGCCGG TGGCGACGGG CGCGCTGCGC GAGCACGCCC TCGGGCACAT GGCGGGCCTC 
GTCGTGATCC TGTGCGCCGA CCCGGCGCCG GGCCCCGTCC CCGCGCCCCT CGACCGCGCG 
GCGGCCCGGA TCGGGGCGAT CAAGGCCGAG ATCGAGCTGC GCCTCGACGA CCGCACGATC 
ACGGCGCGGC GCGTCGCGCA GCAGCACGGG ATCAGCCTGC GCTCGCTCCA GAAGCTGTTC 
GAGGCGGAGG GCCGGACCTT CTCGGACTTC GTGCTGGAGC GCCGGCTCGA CCGGGCGTTG 
CGCCTCCTGC GCTCGCCCGC GCGGCGGCGC CAGCCGATCA GCGCGATCGC CTTCGAGGTC 
GGGTTCGGCG ACCTCTCCTA CTTCAACCGC ACCTTCCGGC GGCGCTACGG GATCGCGCCG 
CGCCGGGCCC GCGCCGCGCC GGGCGATCCG CCCGAGGGCC ACTGA

Protein sequence

MEDGLTRNPD PGAPPGGLAP VWILAEGAPP GGGFAPPRAA GRTAPVRRAP PPELPFGAAA 
LLRLEPDIGL MSCFRPTPET DLPVASPVLP GGAVLLRPHG GAVRARVGGT HVLVEDGEAI 
LLAGPASLRV ADAGRLDALA LPARAVTPAM AEVAASLRVF PRDSAALALL HHYGAALMRG 
LLPVATGALR EHALGHMAGL VVILCADPAP GPVPAPLDRA AARIGAIKAE IELRLDDRTI 
TARRVAQQHG ISLRSLQKLF EAEGRTFSDF VLERRLDRAL RLLRSPARRR QPISAIAFEV 
GFGDLSYFNR TFRRRYGIAP RRARAAPGDP PEGH