Gene AnaeK_4114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_4114
Symbol
ID	6785584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	4651390
End bp	4652391
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	79%
IMG OID	642765581
Product	ABC transporter, substrate-binding protein, aliphatic sulfonates family
Protein accession	YP_002136446
Protein GI	197124495
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0996605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCGCT CCGCCAGCGC CGTCGCCGCG CTCGTCACGC TGGGTGCCGT GCTGCTCGCG 
GCGCCGCTCG CCTGCCGGCG CGGCGGCGAT CCGGCCACCC GGCCGCTGCG CGTCGGCCAC 
TTCCCCAACC TCACCCACGC GCAGGCGCTG GTGGGCTTCG CCGACGGGAC GTTCGCGCGC 
GCGCTCGGCG GCCGGGTGGA GGCGAAGCAG TTCAACGCCG GCCCGGCGGC GATCGAGGCG 
CTGGCGAGCG GCGACCTCGA CGCCGCCTAC GTCGGCCCGG GCCCGGCCAC GGTGGCCTAC 
CTGCGCACGC GCGGCGACCT GCTCCGCGTC GTCGCGGGCG CGACCTCCGG CGGCGCGGTG 
CTGGTGGTGC GCGACGCGCG GCGCGCCGCC GACCTCGCCG GCCAGCGGGT CGCGAGCCCG 
CAGCTCGGGA ACACGCAGGA CGTCGCGCTC CGCACCTGGC TCTCCGCGCA GGGCCTCGGC 
GTCGGGGACG GGCCCGGCCA GGTGCGGGTG TATCCGGTGG CGAACGCGGA GATCCTCGGG 
CTGTTCGCGC GCGGGGAGCT CGCCGCGGCG TGGGTGCCGG AGCCGTGGGG CGCGCGCCTG 
GTGGCCGAGG CCGGCGGGCG CATCCTGCTG GACGAGCGCA CGCTGTGGGA GGGCGGCCGC 
TTCCCCACCG CGGTGCTGGC CGTGTCGCGC CGCGCGCTGG AGACGCGGCG CGCCGACGTG 
CTCGCGCTGG TGCGCGCCCA CCTCGAGCTC ACCCGCCGCT GGGAGCGGGA TCGCGAGGCC 
TTCGCGCGCG CCGCGAACGC GGCGTTCGGG GCGCTCACCG GCAAGCCGCT CCCCGAGCCG 
GTGCTGCACG ACGCGTTCTC GCGCATCGAC CCCGCCTCCG ACCCGATGGC CGCGCAGCTC 
GCGCGCATGG CGGAGCAGGC GCGCGCGCTG GGATTCGCGC CCGCCGGCGA GGTTTCGGGT 
ATGGTCGACG GCTCCCTGCT GCAGGAGCTG TCGGCCCCAT GA

Protein sequence

MRRSASAVAA LVTLGAVLLA APLACRRGGD PATRPLRVGH FPNLTHAQAL VGFADGTFAR 
ALGGRVEAKQ FNAGPAAIEA LASGDLDAAY VGPGPATVAY LRTRGDLLRV VAGATSGGAV 
LVVRDARRAA DLAGQRVASP QLGNTQDVAL RTWLSAQGLG VGDGPGQVRV YPVANAEILG 
LFARGELAAA WVPEPWGARL VAEAGGRILL DERTLWEGGR FPTAVLAVSR RALETRRADV 
LALVRAHLEL TRRWERDREA FARAANAAFG ALTGKPLPEP VLHDAFSRID PASDPMAAQL 
ARMAEQARAL GFAPAGEVSG MVDGSLLQEL SAP