Gene MCA1181 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1181
Symbol	cysA
ID	3104525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1235941
End bp	1236987
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	637170361
Product	sulfate ABC transporter, ATP-binding protein CysA
Protein accession	YP_113646
Protein GI	53804706
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.36202
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCG AAATCCGCAA CATCACCAAA TCCTTCGGCA GCTTCCAGGC CCTCAAGGGC 
ATCGACCTGA CCATCGGTTC CGGCGAACTG GTGGCCCTGC TCGGCCCCTC CGGCTGCGGC 
AAGACCACGC TGCTGCGCAT CATCGCCGGG CTGGAGGCCG CCGACAGCGG CCAGATCCTG 
CTCCACGGGG AAGACACGAC GCACCGCCAC GTCCGCGAGC GCCGGGTCGG CTTCGTGTTC 
CAGCACTACG CCCTGTTCCG GCACATGAGC GTGTTCGAGA ACATCGCCTT CGGCCTGCGG 
GTGCGCCCGC GCGGCCAGCG CCCGCCCGAA GCAGAAATCC GGCGGCGGGT GCAAGAATTG 
CTGGAGCTGG TCCAGCTCGA CTGGCTGGCC GACCGCCATC CCGGCCAGCT CTCCGGCGGC 
CAGCGCCAGC GCATCGCACT GGCCCGCGCC CTCGCCGTGG AACCGAAAGT CCTGCTGCTC 
GACGAGCCGT TCGGCGCGCT GGACGCCAAG GTCCGCAAGG ATCTGCGCCG CTGGCTGCGG 
CGCCTGCACG ACGGGCTGCA CATCACCTCG GTGTTCGTCA CCCATGACCA GGAAGAAGCG 
CTGGAAGTCG CCGACCGGGT CGTCGTGCTG AACGCCGGCC AGATCGAACA GGTCGGCTCG 
GCGGACGAGG TCTACGACCA TCCCGCCACG CCTTTCGTGT GCCAGTTCAT CGGCGACGTC 
AACCTGTTCC ACGGCCGGGT GCACGGCGGC CGCGCCCTTA TCGGCGAGAC GGTGATCGAG 
CTGCCGGACA TAGCGGAGTC GGACACCGAA AAGGCCTTGT TCTTCGCCCG TCCCCACGAA 
ATCGAAATCG GCCGCGGCAC GGGCATCGGC GCCGTCGTCC GGGCCATCCG GCGGCGCGGC 
AACGCGGTGC GGGTGGAGCT GGAGCGCAAG GATGGCAGGG GCGCCGTGGA AGCGGAACTC 
AGCCGCGAAG CCTTCGGCCG CCACGCCATC AAGCACGGCG ACGAAGTGGT GATCCAGCCC 
AGCAAGATCA GGATGTTTCA GCCCTGA

Protein sequence

MSIEIRNITK SFGSFQALKG IDLTIGSGEL VALLGPSGCG KTTLLRIIAG LEAADSGQIL 
LHGEDTTHRH VRERRVGFVF QHYALFRHMS VFENIAFGLR VRPRGQRPPE AEIRRRVQEL 
LELVQLDWLA DRHPGQLSGG QRQRIALARA LAVEPKVLLL DEPFGALDAK VRKDLRRWLR 
RLHDGLHITS VFVTHDQEEA LEVADRVVVL NAGQIEQVGS ADEVYDHPAT PFVCQFIGDV 
NLFHGRVHGG RALIGETVIE LPDIAESDTE KALFFARPHE IEIGRGTGIG AVVRAIRRRG 
NAVRVELERK DGRGAVEAEL SREAFGRHAI KHGDEVVIQP SKIRMFQP