Gene A2cp1_3313 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A2cp1_3313
Symbol
ID	7300205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter dehalogenans 2CP-1
Kingdom	Bacteria
Replicon accession	NC_011891
Strand	+
Start bp	3691607
End bp	3692935
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	67%
IMG OID	643596122
Product	extracellular solute-binding protein family 1
Protein accession	YP_002493713
Protein GI	220918409
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.778026
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGCG ATCGCGGGTC CTCGAGGTGG AGCCGTCGGC AGTTCGTGAA GGCTGCGGGC 
GTGGGCGCCC TGGCGGCGGC CGGGCTGCCG CGCCGCGCGC GCGCGCAGGG CGGCAAGACG 
CTCAAGATCA TCCAGTGGAG CCACTTCGTG CCGGGCTACG ACAAGTGGTT CGACGGCACC 
TTCTGCAAGC AGTGGGGCGA GAAGCACGGC ACGCGGGTGA TCGTCGATCA CATCTCCATC 
CCGGAGATCA ACGCCCGCGC CGCCGCCGAG GTCTCCGCGC AGAAGGGCCA CGACCTGTTC 
ATGTTCCTCT CGCCGCCGGC GGCGTACGAG AAGCAGGTCA TCGACCACAC CGAGATCTAC 
CAGCAGGTGG AGAAGCGCTG GGGCAAGGTG AACGACCTCG GGCACAAGTC CACGTTCAAC 
CCGAAGACCA GGAAGTACTT CGCGTTCGCG GACAGCTACG TCCCGGACCC CGGCAACTAC 
CGGCAGGATC TCTGGTCGCA GGTCGGCTTC CCGCACGGCC CGGACACCTG GGAGGACCTG 
CGCAAGGGTG CCGCGGCCAT CAAGCAGAAG ATCGGCAACC CGTGCGGCAT CGGGCTCTCG 
CAGGAGCTCG ACACGAACAT GGCCATGCGC GCGCTGCTCT GGTCGTTCGG CGGCTCGGTG 
CAGGACGCGG AGGGCCGGGT GGTCATCAAT TCGCCGCAGA CCATCCAGGC GCTCGAGTTC 
ATGCGCGCGC TGCAGAAGGA GGCGCAGACC GGGGAGGTGT TCACCTGGGA TCCCTCCTCG 
AACAACCGGG GCATCCTGGC CGGCAAGCTC TCCTTCGTGC TGAACGCGAT CTCGGTGACG 
CGCACCGCCG AGAAGGAGAA CCCGGAGATG TCGAAGAAGA TCCAGATCGT GCCCGCGCTG 
AAGGGGCCGG TGCGCCGGAT GGCGGCCGAG CACGTCATGG ACTGCTACGT CATCTGGAAG 
TTCGCCGAGA ACAAGGACGG CGCGAAGCAG TTCCTGGTGG ACTACCTGGA CGCGTTCGGC 
GACGCGTTCA AGGCGAGCGA GTTCTACAAC TTCCCCTGCT TCCCGAAGAC GGTGCCGGAC 
ATCGCCCAGC AGGTGGCGAA CGACCCGAAG GGCGTGCCGC CGGACAAGTA CAAGGTGCTC 
GCGGGCGTGA CCGAGTGGGC CACCAACGTC GGCTACCCCG GCTACGCCAC CGCCGCCGTG 
GACGAGGTGT TCAACACCTT CGTGATCCCG ACGATGTTCG CGAAGGTCGC GCGCGACGAG 
ATGCCGGCGC GCGACGCCGC CAAGGCGGCC GAGGCCGAGG TGAAGCGCAT CTTCGACAAG 
TGGAAGTGA

Protein sequence

MASDRGSSRW SRRQFVKAAG VGALAAAGLP RRARAQGGKT LKIIQWSHFV PGYDKWFDGT 
FCKQWGEKHG TRVIVDHISI PEINARAAAE VSAQKGHDLF MFLSPPAAYE KQVIDHTEIY 
QQVEKRWGKV NDLGHKSTFN PKTRKYFAFA DSYVPDPGNY RQDLWSQVGF PHGPDTWEDL 
RKGAAAIKQK IGNPCGIGLS QELDTNMAMR ALLWSFGGSV QDAEGRVVIN SPQTIQALEF 
MRALQKEAQT GEVFTWDPSS NNRGILAGKL SFVLNAISVT RTAEKENPEM SKKIQIVPAL 
KGPVRRMAAE HVMDCYVIWK FAENKDGAKQ FLVDYLDAFG DAFKASEFYN FPCFPKTVPD 
IAQQVANDPK GVPPDKYKVL AGVTEWATNV GYPGYATAAV DEVFNTFVIP TMFAKVARDE 
MPARDAAKAA EAEVKRIFDK WK