Gene Cfla_2520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2520
Symbol
ID	9146424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2823671
End bp	2824801
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID
Product	putative sugar ABC transporter, substrate- binding protein
Protein accession	YP_003637607
Protein GI	296130357
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACTGG CGTGGAAGAA GAGCGCGATC GCGATGGTCG CCGCAGGCAT GCTGCTCGGC 
TCGCTCGCGG CGTGCAGCAG CGAGCGCGAG CCCACCACGG AGGGCACCGG CGACGCCGGC 
AGCTCCGAGG ACACCGTCGT CGGCATCGCG ATGCCGACGA AGGCGCTCGA GCGGTGGAAC 
CGCGACGGTG CGCACCTCGA GGGCCTGCTG CAGGACGCCG GCTTCGAGAC GAGCCTGCAG 
TTCGCCGACA ACAAGGTCGA CCAGCAGATC ACGCAGCTCG AGAACATGAT CAACCAGGGC 
GCGGACATCC TCGTCATCGC CTCGATCGAC GGCACGGCGC TCGCGCCGAC CCTCGAGCAG 
GCCGCCGAGC AGGGCATCAC CGTCATCGCG TACGACCGCC TCATCAACGA CACCCCGAAC 
GTCGACTACT ACGCGACGTT CGACAACTAC GGCGTCGGCA AGATGCAGGG CGAGTTCATC 
GTCGAGCAGC TCGACCTCGC CGGCGGTGCC GGCCCGTTCA ACCTCGAGCC GTTCGCCGGC 
TCGCCCGACG ACAACAACGC GAAGTTCTTC TTCGCCGGTG CCTGGGACGT CCTCAAGGAG 
TACGTGGACA GCGGCCAGCT CGTCGTCCCG TCCGGCAAGG CCCCCGCGTC CAACGACGAC 
TGGCAGTCCA TCGGCGTCCA GGGCTGGAGC TCCGACACGG CCCAGTCCGA GATGGAGAAC 
CGCCTCAACT CGTTCTACGC GGGCGGCACC AAGGTCGACG TCGTCCTGTC GCCCAACGAC 
TCGCTGGCCC TCGGCATCGC CCAGGCGCTC GCGGGCAACG GCTACGCGCC CGGCCCGGAC 
TACCCGATCC TCACGGGGCA GGACGCCGAC AAGGCCAACG TCCTCAACAT GATCGAGGGC 
AAGCAGTCCA TGTCCGTCTG GAAGGACACC CGCACGCTGG GTGACCGCAC CGCCACGATG 
ATCGAGCAGA TCGTCGCCGG TGACGAGGTC GAGGTGAACG ACGAGGAGAC CTACGACAAC 
GGCGAGAAGG TCGTCCCGAC CTACCTCCTG CCGCCGCAGG TCATCACGCC GGACACGGTG 
CAGACCCTCG TGGACTCGGG CTTCTACACG GCCGCCGACC TCGGCCTGTG A

Protein sequence

MSLAWKKSAI AMVAAGMLLG SLAACSSERE PTTEGTGDAG SSEDTVVGIA MPTKALERWN 
RDGAHLEGLL QDAGFETSLQ FADNKVDQQI TQLENMINQG ADILVIASID GTALAPTLEQ 
AAEQGITVIA YDRLINDTPN VDYYATFDNY GVGKMQGEFI VEQLDLAGGA GPFNLEPFAG 
SPDDNNAKFF FAGAWDVLKE YVDSGQLVVP SGKAPASNDD WQSIGVQGWS SDTAQSEMEN 
RLNSFYAGGT KVDVVLSPND SLALGIAQAL AGNGYAPGPD YPILTGQDAD KANVLNMIEG 
KQSMSVWKDT RTLGDRTATM IEQIVAGDEV EVNDEETYDN GEKVVPTYLL PPQVITPDTV 
QTLVDSGFYT AADLGL