Gene M446_7020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_7020
Symbol
ID	6020328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010373
Strand	-
Start bp	38037
End bp	39386
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	66%
IMG OID	641568630
Product	hypothetical protein
Protein accession	YP_001691269
Protein GI	169825376
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5434] Endopolygalacturonase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	0.361507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.742896
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTTC TTACCGCACG CGCCGTTCTG GTTGCAACGG CAGGCTTGAT GACCGTCGGC 
GCCACTCATT CGGCACAGTC CCAGGACAGG CGAAACGTCC AGGAGCCGGT TCCGCCGACG 
CAGGTCTGCG CAGTCCTGAG TGCGGACGAC GCTCCGTCGG CCAAGGTCGG ACAAGCGAAA 
TTGCAGGCCG CCCTGGACGG CTGCCGGACG GGCCAAGCGG TGCGGCTCAC GCCCAGCAGG 
ACGAAGGCGG TGTTCGCGAG CGGGCCGATC GAGATGCGGG CCGGCGTGGT TCTCTGGCTC 
GACGCCGGGG CCGTGCTCGC CGCCGAGCCC GATCCTCGCC TCTACGACCT CGGCGACGGC 
CGTTGCGGAC TGATCAATAA CGCGGGGGGG GGATGCCGGC CTTTCCTCAA TTTTCACAAG 
GCCAACGGCG CGGGCCTGAT GGGCGACGGC ACGATCGACG GCCAGGGCGG GGCGGTCATG 
ATCGGCAAGG CGGAGACCTG GTGGGCCCTG GCCAGTCGCG CTCAGGTCGA GGGTAGGGAG 
CAGAACGTCC CCCGGCTGGT GCAGATCGAC AGCTCGAACA ACATCACCGT ATACCGGATC 
ACGCTGCGCA ACGCGCCGAA CGTACACATC GCCATGAACA AGGTCCAGGG CGTGACGGTG 
TGGGGCGTCA CCATCAACAC CCCGGCCGAT GCCCGAAACA CGGACGGGAT TGATCCAGGC 
GCGGCGATGG ACGTGACCAT CGCCCGCACC TTCATCAGCA CCGGCGACGA CGACATCGCC 
ATCAAGGCCG GCGACAACGG AGCGACCCGC CACGTCTCCA TCTTGGACAT CCACATCTAT 
TCGGGGCACG GGCTCTCGAT TGGCAGTGAG ACGAACAGTG GCGTCAGCGA CGTCCTCGTC 
CGAAACGTCA CCATCGACGG CGCGGTGTCA GGCCTGAGAA TCAAGAGCGA TCCGAGTCGG 
GGCGGTTTGG TGCAGGCGGT CCGCTACGAG AACGTTTGCG TGCGCGGAAG TCGGCGGCCG 
ATCGACTTCG ACACGCGCTA TGATCCACGC GCTCAGGGTA CGAAGATCCC CGTGTATAGC 
AACATCGTCC TGCGCCAAGT TGCCGGAGAG GGCGGTCGGC TGGTCATGCA CGGGTACGAC 
GCCGCTCACC CCTTGGGCGT TTCGCTGGAT GGCGTTCGCT TCGTCGACAA CGCGACGTGG 
GACGTGGTCA ACACCCAGGC CATCGTCATG GCGGGTGGCG TGACCCCGCC GATTGGCGCC 
CCGGCGGCGG CGTGGTCGGC GGTCAACGGG CCGAACTGCA AGGCTCTTTG GACGCCGTTT 
CCGGGCGACA CGGCGGTGCA GTCCCATTGA

Protein sequence

MKVLTARAVL VATAGLMTVG ATHSAQSQDR RNVQEPVPPT QVCAVLSADD APSAKVGQAK 
LQAALDGCRT GQAVRLTPSR TKAVFASGPI EMRAGVVLWL DAGAVLAAEP DPRLYDLGDG 
RCGLINNAGG GCRPFLNFHK ANGAGLMGDG TIDGQGGAVM IGKAETWWAL ASRAQVEGRE 
QNVPRLVQID SSNNITVYRI TLRNAPNVHI AMNKVQGVTV WGVTINTPAD ARNTDGIDPG 
AAMDVTIART FISTGDDDIA IKAGDNGATR HVSILDIHIY SGHGLSIGSE TNSGVSDVLV 
RNVTIDGAVS GLRIKSDPSR GGLVQAVRYE NVCVRGSRRP IDFDTRYDPR AQGTKIPVYS 
NIVLRQVAGE GGRLVMHGYD AAHPLGVSLD GVRFVDNATW DVVNTQAIVM AGGVTPPIGA 
PAAAWSAVNG PNCKALWTPF PGDTAVQSH