Gene Mchl_2554 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_2554
Symbol
ID	7117301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	2683977
End bp	2685155
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	643525302
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002421324
Protein GI	218530508
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.311361
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.38185
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGGGC GGATTGTCGT TGTCGCGGGG CTGCTTTTTG CCCCACTCTC CGCCCTGGCC 
GTCGAGACCG CGCCGACCGA AGGCCAGGAC TACGCCGCCG CCAAAGGCTG GTACGAGAAG 
GCCGCCGCCG CGGGTGACGC CACCGCCATG CACAAGCTCG GCCTTCTCTA CGAGGAGGGC 
CAGGGCGTCG CGCAGGATTA TGCCGCCGCC CGAGGCTGGT ACGAGAAGGC CGCCGCCAAG 
GGGTTGGCGG AGTCGATGTA CAATCTCGGC ATTCTCGACG AGTTCGGCCG GGGCGTGGCG 
CAGGACTACC CGGCCGCCAA GGGCTGGTAC GACAAGGCGG CCGCCGCGGG TGATGCGGAC 
GCCATGCAGA AGCTCGGCTA CTTCTACGAT GTCGGCCAGG GCGTGCCGCA GGACTATGCC 
GCGGCCAAGG ACTGGTACGA GAAGGCGGCG GCCGGGGGCA GCGCCAGCGC CATGAACAAT 
CTCGGCGTGC TGTACGAGAA CGGGCAGGGC GTGAAGCAGG ACTATGCCCG CGCCAAGACC 
TGGTACGAGA AGGCCGCCGC CGCCGACACG GGCGACGCCA TGCGCAGCAT TGGGCGTCTG 
TATCTCAATG GCCTGGGCGT GACGCAGGAT TACGCCGCGG CCAAGGGCTG GTTCGAGAAG 
GCCGCGAGCG CGGGCAGCGC GGAGGCCATG AACGATCTCG GCCTCGTCTA CGAGGACGGG 
CAGGGCGTTG CGAAAGACGA TGCCGCCGCC AAGGGCTGGT ACGAGAAGGC CGCCGAGGCG 
GGCAACCCGT TCGCCATGAC CAATCTCGGC TCTCTGTACG AGAACGGACA GGGCGTGAAG 
CAGGACTACG CCACGGCCAA GCTCTGGTAT GAAAAGGCCG CTGCCGCGGG CAATGCCCAG 
TCCATGTACA ATCTCGGTGC CCTGTACGAG AACGGCCAGG GCGTGAAAAA GGACTACGGA 
GCGGCCAAGC TCTGGTACGA GAAGGCGGCC GATGCCGGGA GTTCGGAGGG CATGTCCGCG 
CTCGGCACCC TCTACGCCGA GGGGTGGGGT GTGGCGCGCG ACCGGAGCGC CGCCAAGCTC 
TGGTATGAGA AGGCCGCCGC CCTCGGCGAC ACGGGGGCGA TGCAGAAGAT CGCCGCCCTG 
TTCGAGAAGG GCACGGGCAA AGCGGGCGCC AAACGCTAG

Protein sequence

MLGRIVVVAG LLFAPLSALA VETAPTEGQD YAAAKGWYEK AAAAGDATAM HKLGLLYEEG 
QGVAQDYAAA RGWYEKAAAK GLAESMYNLG ILDEFGRGVA QDYPAAKGWY DKAAAAGDAD 
AMQKLGYFYD VGQGVPQDYA AAKDWYEKAA AGGSASAMNN LGVLYENGQG VKQDYARAKT 
WYEKAAAADT GDAMRSIGRL YLNGLGVTQD YAAAKGWFEK AASAGSAEAM NDLGLVYEDG 
QGVAKDDAAA KGWYEKAAEA GNPFAMTNLG SLYENGQGVK QDYATAKLWY EKAAAAGNAQ 
SMYNLGALYE NGQGVKKDYG AAKLWYEKAA DAGSSEGMSA LGTLYAEGWG VARDRSAAKL 
WYEKAAALGD TGAMQKIAAL FEKGTGKAGA KR