Gene Mchl_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_3663
Symbol
ID	7115652
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	3858863
End bp	3859903
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	72%
IMG OID	643526398
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_002422410
Protein GI	218531594
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01216] ATP synthase, F1 epsilon subunit (delta in mitochondria)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.790571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATCGC ACTTCATCCG GTGGGCAATT CTTCTCTTCG CGCTGTTGGG TGCCTCGGGC 
GCCGCCTTGG CGCAAGGCCA GGTTCAGAGC CTGCCGGTGC GGATCGGCGC GATCCCCGTG 
CTCGGTGCCG CGCCGCTCTT CGTCGCCGAG CGGGAGGGCT GGCTCGGGGC CGGCGGGCTC 
AAGCCCACCG TAACGCTGTT CGATTCCGGG CCGAACGCGG TGCAGGCAGC GGCGAGCGGC 
ACGGTCGATG TCTACGTCGC CGGGATCACG CCGGTGGCGA TCGGGCGGAC GCGTGGGGTC 
GATCTGCGGG TGGTGGCGGC GACCGCTATC GGCGAGAACG TGCTCGTAGC GGGCGCCAAG 
CTCGCCGGAC CGCTCACCGA CGGCACGGCA CCGGCTGCCG CCTTTCGGCG CTTCCGGGAG 
GAGACGGGCC GCCCGGCCAA GATCGCCACG CAGCCGCCCG GTTCGATCCC CTACACCAAT 
CTCTCCTACT GGCTGCGCGA GGTCCACAAG GTCGATCCGG CCGACGTGCA GATCCTGACA 
CTCGGCATCG ACGCGGCGCA GCAGGCGATC CTCGCCGGCG CGGTCGAGGC CGCGACGGTG 
CGTGAGCCGG GCCTCAGCAT CATCCGCGAG CGCAACCCGC AGATCCGCCT CGTCGCTAGC 
GGCAGCGAGC TGTTTCCCGG CCAGCCCGGC ACCGTCGTGG CGGTGCGCGG CGCCTTCCTC 
GAGCAGAATC CGGCGGCCGT GCGCACCCTC GTCTCGGCCA TCGTGCGGGC CGTCGATCTG 
ATCAAGCGCG AGCCCGAGCG GGCGCTTCCC GCGGTGGAGG CCGCGCTCGG CAAGGGCATC 
GTCACTGCCG CGACCCTGCG CAACGCGCTC GCCTCGCCGG CGACCCAGTA TGTCGCCGAT 
CCCCGCACCA TCGTGGCGGC GACCGGCGCG ATGCTGGCCT TCCAGACCAA GCTCGGCATC 
AGCGAGCAGA CGCCGCCGAC GGAGGGATTG TTCGACCCCC GCTTCTTCGA GGCGGCCCAG 
GCCGAGGCGA GCGCGCGATA G

Protein sequence

MSSHFIRWAI LLFALLGASG AALAQGQVQS LPVRIGAIPV LGAAPLFVAE REGWLGAGGL 
KPTVTLFDSG PNAVQAAASG TVDVYVAGIT PVAIGRTRGV DLRVVAATAI GENVLVAGAK 
LAGPLTDGTA PAAAFRRFRE ETGRPAKIAT QPPGSIPYTN LSYWLREVHK VDPADVQILT 
LGIDAAQQAI LAGAVEAATV REPGLSIIRE RNPQIRLVAS GSELFPGQPG TVVAVRGAFL 
EQNPAAVRTL VSAIVRAVDL IKREPERALP AVEAALGKGI VTAATLRNAL ASPATQYVAD 
PRTIVAATGA MLAFQTKLGI SEQTPPTEGL FDPRFFEAAQ AEASAR