Gene Meso_4520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Meso_4520
Symbol
ID	4178444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chelativorans sp. BNC1
Kingdom	Bacteria
Replicon accession	NC_008243
Strand	+
Start bp	83649
End bp	84896
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	61%
IMG OID	638059407
Product	extracellular solute-binding protein
Protein accession	YP_666129
Protein GI	110347312
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAC TATCGAAATT CTTAGGGCTC AGCATGCTGA GCATTGCCAT GACGCTGCCG 
GCCGTTGCCG CCTCCGCCGA AGAGATCACC TGGTGGGCCC CGAACTGGGG TGAGGCGCGC 
GCCCGGAAAC TGGTCGAGGA CTTCCAGGCC GCCAACCCGG ATGTCACGGT TAACCTGGAG 
ATCACCGTTT CGAACGGCCT CCAGAGCCGC ATCGAGGTCG CCCTGCGCTC GGGAAACCCG 
CCGGACCTGA TCGACACCAG CATGCAGTGG GTCATCCCGT TCGCCAGCAG CGGCAAGCTG 
CTCGATCTCG ACCAGTTCGC CAAGGAACAG GTTAACCTCG ACGACCTTCT GCCGGCCACA 
CTGGATTCCA CCCGCTACAA CGGCCACATC TACGGCCTGC CTTATCGGGC CCAGACCCTG 
GCCTTGATCT ACAACAAGGC GCTTTATCGC GACGCCGGTC TCGACCCGGA CAATCCGCCG 
AAGACCTGGG ACGAATTCAT CAAGGCCTCG CAGGCGCTGA CGAAGACCAA TACGGCCGGC 
AAGCAGCAGT ATGGCATCGG CGTTGCCGGC GGCGGCGAAT TGGGCAATCT GATCACCCGC 
ATGGTTCCGT TCATTTGGAT GAACGGCGGC GATGTTCTCA ATGCCGATTT CACCGAGGCG 
ATCGTCAACG AGAAGCCGGC GGTCGAAGCC GTCGAGTTCT ACACGGCACC GCTGACCAAG 
TACAACATTG CACCGCCTTC GACGCTGCAG AACGACGGCC TTGCACTGCG CAGGCTTTTC 
GGCGCCGGAA CCGTCGCGCA ATATTTCTCC GGACAGTTCG ACCTTCCCGC CATCAAGCAG 
GAAGCGCCTG ACCTGGAGAT CGGCATCGCT CCGTTCCCGC ATCCGGAAGG CAAGCAGACT 
GCGGGTATCC TGAGCGGCTG GGCTTTCGTA GTGCCGGCCG ATTCGCAACA TAAGGACGCC 
GCACTCCGTT TGGCGAAATT CCTCATGCTG CCGGAAAACC AGGGCTATTA CACCGATACC 
TTCCCGGCCA GTATGAGTGC CATGGACCTG CCAAGGTTTA AGGACCCGCT TCTGCAGCCC 
TTCAAGGAGA TGCTGAAGTT CACCAAGCCC GCGCCTTCGA CACCCGTCTG GATCAAGGCT 
CAGCAGATCC TCTTTGCCCA CACCCAGGAA GTCCTGCTCA ACTCCGCAAC GGCGCAGGAA 
GCCATGGATG CTGCGGCCGA AGAGATAAAC GACGCGCTCG CCCGCTGA

Protein sequence

MKRLSKFLGL SMLSIAMTLP AVAASAEEIT WWAPNWGEAR ARKLVEDFQA ANPDVTVNLE 
ITVSNGLQSR IEVALRSGNP PDLIDTSMQW VIPFASSGKL LDLDQFAKEQ VNLDDLLPAT 
LDSTRYNGHI YGLPYRAQTL ALIYNKALYR DAGLDPDNPP KTWDEFIKAS QALTKTNTAG 
KQQYGIGVAG GGELGNLITR MVPFIWMNGG DVLNADFTEA IVNEKPAVEA VEFYTAPLTK 
YNIAPPSTLQ NDGLALRRLF GAGTVAQYFS GQFDLPAIKQ EAPDLEIGIA PFPHPEGKQT 
AGILSGWAFV VPADSQHKDA ALRLAKFLML PENQGYYTDT FPASMSAMDL PRFKDPLLQP 
FKEMLKFTKP APSTPVWIKA QQILFAHTQE VLLNSATAQE AMDAAAEEIN DALAR