Gene M446_0512 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_0512
Symbol
ID	6129211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	610156
End bp	611187
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	72%
IMG OID	641640834
Product	AraC family transcriptional regulator
Protein accession	YP_001767509
Protein GI	170738854
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.594629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00245431
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGGATC GGACCATCCA GAGCGGCGGG AGCGACGGCG CGCGGGTGCT CAGCCACAAG 
TTCGAGCCGC CCGCCGATCC GCGCGACCTG GCGCGCGCGT GGTGCGAGCA CATCGCACCC 
GCCTTCGAGG TCGGCCTGCG GCCCGAGGCC GACCTGTCGG CGCCGATCGC GATGCAGACC 
TACCACCTCG GGGACCTGAT CGTCGGGGAC GTGATCGCGC CCGCCCACGT CCTGGAGCGC 
GGATCGCGGA TGATCGAGCG GCAGGGGATC GACCACATCC TGATCCAATT CTACCGGCGC 
GGGCAGAGCA CCGTCGAGCG GCGCGACGGG AGCGAGCGGG TCACGGAGGG GCAATGCGTG 
GTCTTCGATC TCGCCCAGCC CGTCCGCATC GTCGCCGAGC CGGTCGATGC GACGAACCTC 
GTCGTGCCCC GCGCCCGCCT GGAGGACCAG GGATGCCAAG TGGGCGGCCT CCACGGCCGC 
GCCTTCGACT ACGACGGCGA CCCGTTCGGA CGGCTGTTCC ACGAGTTCCT CGCCAACCTC 
GTCGCCTGCG GCGACCTGCT CCATCCGCGC GAGGCCGCCG CCGGCGCGCG CGCCCTGGTG 
CAGCTCTGCG ACACCTTCCT GCGCGGGCGC GCGGGGAACG GCCCCCCGCA GAACCTCGAC 
GCGCGCATCC GGGTCCGGCG CTTCATCGAG CGTCAGCTTC ACGATTTCGA CCTGGGCCCG 
GCCATGATCG CGGCGCAGCT GGGCCTGTCG CGCTCCACCC TGTACCGCCT CTTCGGTGAG 
ACGGGCGGCG TGCTGGCCTA TATCCGGGAC CGCCGCCTGA TGCGCGCGAT GCGCCTCCTG 
GTCCGGTCCG ACGCGGCGCA GCCGATGCGG ATCTCGCAAC TCGCCTACGC GGTCGGCTTC 
GCCGACGAGA AGACGTTCCG GCGCGCCTTC CGGCGCCGGT TCGGGTTCCT GCCGAGCGAG 
GCGATGGCCT ACCAGCTCGG CCCCGACGAT GCCGGGATGC CGGTCCTGCG CCGCTGGTTC 
GACAACCTGT AG

Protein sequence

MADRTIQSGG SDGARVLSHK FEPPADPRDL ARAWCEHIAP AFEVGLRPEA DLSAPIAMQT 
YHLGDLIVGD VIAPAHVLER GSRMIERQGI DHILIQFYRR GQSTVERRDG SERVTEGQCV 
VFDLAQPVRI VAEPVDATNL VVPRARLEDQ GCQVGGLHGR AFDYDGDPFG RLFHEFLANL 
VACGDLLHPR EAAAGARALV QLCDTFLRGR AGNGPPQNLD ARIRVRRFIE RQLHDFDLGP 
AMIAAQLGLS RSTLYRLFGE TGGVLAYIRD RRLMRAMRLL VRSDAAQPMR ISQLAYAVGF 
ADEKTFRRAF RRRFGFLPSE AMAYQLGPDD AGMPVLRRWF DNL