Gene Cfla_3404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_3404
Symbol
ID	9147320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	3788287
End bp	3789381
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	72%
IMG OID
Product	putative sugar uptake ABC transporter periplasmic solute-binding protein precursor
Protein accession	YP_003638480
Protein GI	296131230
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.538992
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACCA GATCCCTCGC CCTCGTGGCA CTGACCGCCG CCGGCGCCCT CGCCCTCGGC 
GGGTGCGGCG GCGGCCGCGA AGGAACAGCG GATGCCGCAG CCGCCGGTGC GGGCGACGGC 
TTCGCCGACG ACGCCGTCAT CGGGGTGTCC CTGCCGTGGC TCGGTACCCA GAACTGGGCC 
GAGGCGCAGG AGATGTTCAC CACCCGGCTG ACGGAGGCCG GCTTCGAGCC GCTCGTCCAG 
GCGGCGGACA ACAAGGTGAC CCAGCAGCAG CAGCAGATCG AGGCGATGAT CGAGCGCGGC 
GCCGAGGTGA TCGTCGTCGG CCCCGTCGAC GGCACCCAGC TCGGCAGCGT GCTCGAGCGC 
GCCGCCGCGG AGGGCATCGC GGTGATCGGG TACGACCGGC TCATCGAGAA CACGCCGGCC 
GTCGACGCGG TCGTGCAGTT CGGCAGCCTG CGCACCGGCG AGCTGCAGGG GCAGTCGCTC 
CTCGACGGGC TCGCGGCACG CAAGGGCGAG CCGCCGTACC ACGTCGAGCT GTTCGGAGGC 
GGTCCCGCGG ACCCGAACGC CCCGGCGTTC TTCGAGGGCG CCATGTCCGT CCTGCAGCCG 
AAGATCGACG ACGGCACCCT GGTCGTCGGG TCGGGCCAGA CCGAGTTCAC GCAGGCCGCG 
ACACCCGACT GGGACAACGC CAAGGCCCAG GCACGCATGG ACTCCCTGCT GTCGGGCTTC 
TACAGCGCCG AGGAGATCGA CGGTGTGCTG TCGCCGAACG ACGGCATCGC GCGCGCTGTC 
ATGACGTCGG CGCAGCAGGC GGGCCAGGAG ACACCCGTGG TAACCGGCCT CGACGCCGAG 
AACGAGTCGG TCGTGTCGGT GTGGCAGGGG CAGCAGTGGT CGACGGTCGC CAAGCCGACC 
GTCGAGCTGG TCGGCCGCAC GGTCGAGCTG ATCCAGTCCC TCCAGCAGGG CGAGGCGCTG 
CCGGAGCCGG ACGAGGAGGT CGACAACGGC CAGACGGACG TCGCCGTGTA CCTGCTCGAC 
CCCCTCGTGG TGACGCAGGA GAACGCCCAG GAGGTCTTCG CCGACGACCC CAACCGCCTG 
CAGCTGCTGC AGTAG

Protein sequence

MRTRSLALVA LTAAGALALG GCGGGREGTA DAAAAGAGDG FADDAVIGVS LPWLGTQNWA 
EAQEMFTTRL TEAGFEPLVQ AADNKVTQQQ QQIEAMIERG AEVIVVGPVD GTQLGSVLER 
AAAEGIAVIG YDRLIENTPA VDAVVQFGSL RTGELQGQSL LDGLAARKGE PPYHVELFGG 
GPADPNAPAF FEGAMSVLQP KIDDGTLVVG SGQTEFTQAA TPDWDNAKAQ ARMDSLLSGF 
YSAEEIDGVL SPNDGIARAV MTSAQQAGQE TPVVTGLDAE NESVVSVWQG QQWSTVAKPT 
VELVGRTVEL IQSLQQGEAL PEPDEEVDNG QTDVAVYLLD PLVVTQENAQ EVFADDPNRL 
QLLQ