Gene M446_2073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2073
Symbol
ID	6134432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2314012
End bp	2315109
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	76%
IMG OID	641642302
Product	hypothetical protein
Protein accession	YP_001768970
Protein GI	170740315
COG category	[S] Function unknown
COG ID	[COG4641] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.777573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0115222
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCA TCGCCTTCTA CGGCTCGAGC CTCCTCTCCT CCTACTGGAA CGGCGCGGCG 
ACCTACTATC GGGGCCTGAT CCGCGACCTC GCGGGGCGGG GCTGGCGCAC GACCTTCTAC 
GAGCCGGACG CGTTCGACCG GCAGCGGCAC CGCGACATCG ACCCGCCGGA CTGGGCCGCC 
GTGACGGTCT ACCCGGCGAC CGAGGAGGCG GCGCGGGCGG TCATCGCCGA GGCGGCGCGG 
GCCGACGTGG TGGTGAAGGC CTCCGGCGTC GGCGTGTTCG ACGACCTGCT CCTCGCCGGG 
CTCGCCGCCG CGTCCCGGCC CGACGCCCTG CGGCTGTTCT GGGACGTGGA CGCCCCGGCG 
ACCCTCGCGG AGCTGCGCAC CGCCCCCGAC CACCCCCTGC GCCGGGCCCT GCCGGACCTC 
GACCTCGTGC TCACCTACGG GGGCGGCCCG CCGGTGGTGG AGGCCTACGA GGGGTTCGGC 
GCCCGGCGCT GCATCCCGAT CTACAACGCC CTCGATCCCG ACACCCACCA CCCGGTGCCG 
CCGGATCCGC GCTTCGCCGC CGACCTCTCC TTCCTGGGCA ACCGCCTGCC GGACCGGGAG 
GCGCGGGTGG AGGAGTTCTT CCTGGCCCCG GCGGCGCGCC TGCCCGAACG CGCCTTCCTG 
ATCGGCGGCA ACGGCTGGGA GTCGCGCGGG CTGCCCGCCA ATGTCCGGCA TCTCGGCCAC 
GTCTCCACCC GCGACCACAA CGCCTTCAAC GCGACGCCGC GCGCGGTGCT CAACATCGCC 
CGCGACTCGA TGGCGGCGAC CGGCTGGTCG CCCGCCACCC GGGTCTTCGA GGCGGCGGGC 
GCCGGGGCCT GCCTGATCAC CGATGCCTGG ACGGGCCTGG AGATGTTCCT GAGCCCTGGC 
GAGGAGGTGC TGGTGGCCCG CGACGGGGCC GACGTCGCCG CGCATCTGGC CGACCTCACG 
GCCGAGCGCG CCGCGGCGAT CGGGCGGGCG GCCCGCCGCC GCATCCTCGC CGAGCACACC 
TACGCGCGCC GCGGCGCCGC GGTGGACGCG ATCCTGCGCG CGGCCCTGGC GGAGAAGCGC 
GGAGGGCGCG CCCCGTGA

Protein sequence

MSTIAFYGSS LLSSYWNGAA TYYRGLIRDL AGRGWRTTFY EPDAFDRQRH RDIDPPDWAA 
VTVYPATEEA ARAVIAEAAR ADVVVKASGV GVFDDLLLAG LAAASRPDAL RLFWDVDAPA 
TLAELRTAPD HPLRRALPDL DLVLTYGGGP PVVEAYEGFG ARRCIPIYNA LDPDTHHPVP 
PDPRFAADLS FLGNRLPDRE ARVEEFFLAP AARLPERAFL IGGNGWESRG LPANVRHLGH 
VSTRDHNAFN ATPRAVLNIA RDSMAATGWS PATRVFEAAG AGACLITDAW TGLEMFLSPG 
EEVLVARDGA DVAAHLADLT AERAAAIGRA ARRRILAEHT YARRGAAVDA ILRAALAEKR 
GGRAP