Gene Cfla_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_2049
Symbol
ID	9145945
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2286576
End bp	2288567
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	71%
IMG OID
Product	ABC transporter related protein
Protein accession	YP_003637143
Protein GI	296129893
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.146206
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCA CGACGAGGAC CGACCGTCCC GCCGGCCCGC CGCCCGGCGG GCCGCGTGGC 
GGGCCCATGG GCATGGGTCT GGGGATGCCC GGTCAGAAGT CGATGGACTT CCGTGGCTCG 
TTGCGGCGCC TGCTCACGGT GCTGGCGCCC GAGCGTGTCC GGCTCGTCGC CGTACTCGTG 
CTGGGGGCGT TGTCGGTGGC GGCGGCGGTT GCCGGCCCCA AGCTGCTGGG CAACGCGACC 
GACGTGCTGT TCGACGGTGT GGTCTCGCGG CAGCTCGCGC AGCTCCTGCC GGCCGGCAGC 
ACGCAGCAGG AGGCGGTCGA CGCGCTGCGC GCCGCGGGGC AGGGCACGGT GGCAGACATG 
GTCGCGGGCA TGCCCGGCCT GACCGTCGGC GACGGCGTCG ACTTCGAGCG GCTCGGCTCG 
ATCCTGCTGC TGGTGCTCGG CGTGTACGTC GCCGCGTTCG TGTTCGGCTG GCTGCAAGGG 
CGGCTGACGG CGCGCGCGGT GCAGAACACG GTCCTGCGCA TGCGGACGCA GGTCGAGGAG 
AAGCTCACGC GCGTCCCGCT GTCGTACTTC GACAAGCAGC CGCGCGGTGA GCTGTTGTCG 
CGTGTCACCA ACGACATCGA CAACGTCGCG CAGACCGTGC AGCAGACGCT CTCGCAGCTC 
ATCACCTCGG TGCTGACGGT CGTCGGCGTG CTCGCGATGA TGTTCTGGAT CTCGCCGCTT 
CTCGCGGTCG TCGCCCTGGT GACGGTCCCG CTGTCGGTCG TGGTCGCGGC CGCGATCGCC 
AAGCGCTCGC AACCGCAGTT CGTCGAGCAG TGGGCGTGGA CCGGCAAGCT CAACGCCCAC 
ATCGAGGAGA TGTTCACGGG CCACGCGCTG GTCACCGTCT TCGGCCGGCA GCAGGAGGCC 
GCCGCGACGT TCGCCGAGCG CAACGGCAAG CTCTACGAGT CCGCGTTCCG GGCGCAGTTC 
ATCTCCGGAA TCATCCAGCC GGCGCTGGGG TTCATCGCCA ACCTCAACTA CCTCGTCGTC 
GCCGTGGTCG GTGGCCTGCG GGTCGCGTCG GGCACGATGT CGCTCGGCGA CGTGCAGGCG 
TTCATCCAGT ACTCGCGGCA GTTCACGCAG CCGATCACGC AGATCGCGTC GATGGCGAAC 
CTGCTGCAGT CCGGTGTCGC GTCCGCCGAG CGCGTGTTCG AGCTGCTGGA CGCGCAGGAG 
CAGACGCCCG ACCCCGCGCA GCCCGCGACG CTGCCGGAAC GCGTGCGCGG CCGCGTCGCG 
TTCGAGGACG TGTCGTTCCG CTACGACGCG GACACGCCGC TCATCGAGAA CCTGTCGGTC 
GTCGCGGAGC CCGGGCAGAC CGTCGCGATC GTCGGGCCCA CGGGCGCCGG CAAGACCACT 
CTCGTCAACC TCGTCATGCG GTTCTACGAG GTCGACTCCG GGCGCATCAC GCTCGACGGT 
GTCGACACGC GGGACGTCAC GCGCGACGCG CTGCGGTCGC AGATCGGCAT GGTCCTGCAG 
GACACGTGGC TGTACGAAGG GACGATCGCG GAGAACATCG CGTACGGCGT GGACTCCGCG 
ACGCACGAGC AGGTCGTCGA GGCCGCCGTC GCGACCCACG TCGACCGGTT CGTGCGCACC 
CTGCCCGACG GGTACGACAC CGTGCTCGAC GACGAGGGCG GCGCGGTGTC CGCCGGCGAG 
AAGCAGCTGC TCACCATCGC GCGCGCGTTC CTCGCCGACC CGGCGATCCT CATCCTCGAC 
GAGGCGACGT CGTCGGTCGA CACGCGCACC GAGGTGCTCG TGCAGCACGC GATGAACGCC 
TTGCGCGCCG GGCGCACGTC GTTCGTCATC GCGCACCGGC TGTCCACGAT CCGCGACGCC 
GACGTCATCC TCGTCATGGA GCACGGGAGG ATCGTCGAGC AGGGCACGCA CGACGACCTC 
GTCGCGGCCG ACGGTGCGTA CGCGCAGCTG TACCGCAGCC AGTTCGCCGA GGCGGCCGCC 
CCGGTCGACT GA

Protein sequence

MSATTRTDRP AGPPPGGPRG GPMGMGLGMP GQKSMDFRGS LRRLLTVLAP ERVRLVAVLV 
LGALSVAAAV AGPKLLGNAT DVLFDGVVSR QLAQLLPAGS TQQEAVDALR AAGQGTVADM 
VAGMPGLTVG DGVDFERLGS ILLLVLGVYV AAFVFGWLQG RLTARAVQNT VLRMRTQVEE 
KLTRVPLSYF DKQPRGELLS RVTNDIDNVA QTVQQTLSQL ITSVLTVVGV LAMMFWISPL 
LAVVALVTVP LSVVVAAAIA KRSQPQFVEQ WAWTGKLNAH IEEMFTGHAL VTVFGRQQEA 
AATFAERNGK LYESAFRAQF ISGIIQPALG FIANLNYLVV AVVGGLRVAS GTMSLGDVQA 
FIQYSRQFTQ PITQIASMAN LLQSGVASAE RVFELLDAQE QTPDPAQPAT LPERVRGRVA 
FEDVSFRYDA DTPLIENLSV VAEPGQTVAI VGPTGAGKTT LVNLVMRFYE VDSGRITLDG 
VDTRDVTRDA LRSQIGMVLQ DTWLYEGTIA ENIAYGVDSA THEQVVEAAV ATHVDRFVRT 
LPDGYDTVLD DEGGAVSAGE KQLLTIARAF LADPAILILD EATSSVDTRT EVLVQHAMNA 
LRAGRTSFVI AHRLSTIRDA DVILVMEHGR IVEQGTHDDL VAADGAYAQL YRSQFAEAAA 
PVD