Gene M446_6972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_6972
Symbol
ID	6020301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010373
Strand	-
Start bp	4678
End bp	5796
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	64%
IMG OID	641568591
Product	hypothetical protein
Protein accession	YP_001691230
Protein GI	169825337
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACTCTG ATGCGTCGTC TGGCGACGGT CAAGGCTATG ACTTAGGATT AAATATAGGT 
TTGTCTAAAT GCAAGGGGCA AATCACCCCT TTGCGGGTCA TTCCTTCAGG ACATGTTCCT 
ATTGATTTCG TTCACGTTCA TGCGGTACAG GCGATCTGCG ACATTCTGGT TGAGCTGAAA 
ATCGAGCCCG AGAAGATCCT CAAGCTGGCC GGCATTGACA CGCAGATCTT TGGTACCATC 
GAAGCAATCT CGTTCGCGTC GTTGGGCCGC TTGACGGCGC TGGCCGCCGA CCAGACGCAG 
TGCGCCCACT TCGGCCTCCT CATTGGTCAG CGCGTCACTC TCGCCTCGCT TGGTCTGCTC 
GGGACGCGGA TGCGTCACTC AGAGACGGTC GGCGACGCCT TGCAGGCCGT GCGGACGCAC 
CACGATCTCC TGAACCGCGG TGCCGTGATT GAGCTGTCGA TCGACGGCCC GGTCGCGATC 
GTGAGCTATG CGCCGTATGA GCCTGACATC GAGGGGGTGG CGCTCCACTG CGAGAGAGCC 
ATTGCGGCGC TGACCAGCGT GTTGCGGTCG CTGTGCAGCC CTCACTGGAG CCCGGAGGAG 
GTGCTGCTAC CGCGTCTGGA ACCAGAGGAT ACCACACCCT ACACGCGCTT CTTCCGAGCC 
CCGGTCCGGT TCTCGCAGGA GATCGCGGCG CTGGTGTTCC CAGCCCGGGT TCTGAGGCGA 
CCGGTCGAGG GCGCCAACCC GCTCATTCGA GCGGCCGTAG AGCGGCGCAT CCAGCAGCTT 
GAGGCCGTCA TCCCGTCCGG CCTGACCGAC GAGGTCCGGC GGCGCGTGCG CTCGACGGTG 
AGCGAGAAGC GGATCGAGAG GCTTCACGTC GCGCAGTCGC TGGCGATCCA TCAGCGCACA 
CTGGCCCGCC GCCTGAAGGC CGAGGGAACG ACGTTTCGGT CCGTCGCGAA TCAGACGCGA 
CTCGCAATGG CCAAGCAGTT GCTGGCCAAC ACCAACCTGA GCTTAGCGAG GATCTCGGCC 
GCCCTGGAGT TCTCGGAGCC GCCCGCGTTC ACGCGTGCCT TCCACCGCTG GACTGGCATG 
GCGCCGAGCG CATGGCGGAA GGATCACCGC GGCAGTTGA

Protein sequence

MDSDASSGDG QGYDLGLNIG LSKCKGQITP LRVIPSGHVP IDFVHVHAVQ AICDILVELK 
IEPEKILKLA GIDTQIFGTI EAISFASLGR LTALAADQTQ CAHFGLLIGQ RVTLASLGLL 
GTRMRHSETV GDALQAVRTH HDLLNRGAVI ELSIDGPVAI VSYAPYEPDI EGVALHCERA 
IAALTSVLRS LCSPHWSPEE VLLPRLEPED TTPYTRFFRA PVRFSQEIAA LVFPARVLRR 
PVEGANPLIR AAVERRIQQL EAVIPSGLTD EVRRRVRSTV SEKRIERLHV AQSLAIHQRT 
LARRLKAEGT TFRSVANQTR LAMAKQLLAN TNLSLARISA ALEFSEPPAF TRAFHRWTGM 
APSAWRKDHR GS