Gene A2cp1_4140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_4140
Symbol
ID	7298244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	+
Start bp	4626919
End bp	4627920
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	77%
IMG OID	643596946
Product	ABC transporter, substrate-binding protein, aliphatic sulfonates family
Protein accession	YP_002494523
Protein GI	220919219
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCGCT CCGCCCGCGC CCTCGCCGCG CTCGTCACGC TGGGTGCAAC GCTCCTCGCG 
GCACCGCTCG CCTGCCGCCG CGGCGGTGAT GCGGCCACCC GACCGCTGCG CGTCGGCCAC 
TTCCCGAACC TGACCCACGC GCAGGCGCTG GTGGGCTTCG CCGACGGGAC GTTCTCTCGC 
GCGCTCGGCG GGCGGGTGGA GGCGAAGCAG TTCAACGCGG GCCCGGGGGC GATCGAGGCG 
CTGGCGAGCG GAGACCTCGA CGCCGCCTAC GTCGGACCGG GCCCGGCCAC GGTCGCCTAC 
CTGCGCACGC GCGGCGATCT GCTGCGCGTG GTCGCGGGCG CGACCTCCGG CGGCGCCGTG 
CTGGTGGTGC GCGACGCGCG GCGCGCCGCC GACCTCGCCG GCCAGCGGGT GGCGAGCCCG 
CAGCTCGGGA ACACGCAGGA CGTCGCGCTC CGCACCTGGC TGTCAGCGCA GGGCCTCCGC 
GTGGGCGACG GGCCCGGCCA GGTGCGGGTG TATCCGGTGG CGAACGCGGA GATCCTCGGG 
CTGTTCGCGC GCGGTGAGCT CGCCGGCGCC TGGGTGCCCG AGCCGTGGGG CGCGCGCCTC 
GTGGCGGAGG CCGGCGCGCG CATCCTGGTG GACGAGCGCA CGCTCTGGGA AGGCGGGCGC 
TTCCCCACCG CGGTGCTGGC CGTCTCGCGC CGCGCGCTCG AGACGCGGCG CGCCGACGTG 
CTCGCGCTGG TGCGCGCCCA CCTCGAGCTG ACCCGGCGCT GGGAGCGGGA TCGCGAGGCC 
TTCGCGCGCG CCGCGAACGC GGCGTTCGGG GCGCTCACCG GGAAGCCGCT CCCGGAGCCG 
GTGCTGCACG ACGCGTTCTC GCGGATCGAC CCCGCGTCGG ACCCGATGGC GGCGCAGCTC 
GCGCTCATGG CGGAGCAGGC GCGCGCGCTG GGATTCGCGC CCGCCGGCGA TGTTTCGGGT 
ATGGTCGACG GCTCCCTGCT GCAGGAGCTG TCTGCCCGAT GA

Protein sequence

MRRSARALAA LVTLGATLLA APLACRRGGD AATRPLRVGH FPNLTHAQAL VGFADGTFSR 
ALGGRVEAKQ FNAGPGAIEA LASGDLDAAY VGPGPATVAY LRTRGDLLRV VAGATSGGAV 
LVVRDARRAA DLAGQRVASP QLGNTQDVAL RTWLSAQGLR VGDGPGQVRV YPVANAEILG 
LFARGELAGA WVPEPWGARL VAEAGARILV DERTLWEGGR FPTAVLAVSR RALETRRADV 
LALVRAHLEL TRRWERDREA FARAANAAFG ALTGKPLPEP VLHDAFSRID PASDPMAAQL 
ALMAEQARAL GFAPAGDVSG MVDGSLLQEL SAR