Gene Cfla_1992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1992
Symbol
ID	9145887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	-
Start bp	2218297
End bp	2219874
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	74%
IMG OID
Product	anthranilate synthase component I
Protein accession	YP_003637086
Protein GI	296129836
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.221966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCAGC CGTCCGTCTC CGCCGCGCCG CGCGCGACCG CCACGGACCT GCCCTGGGGC 
GCGACCTGGC CGTCGCGCGA GCGGTTCCGC GAGCTCGCGA CCGACCGTCG CGTGGTGCCG 
GTCGTGCGGC GCCTGCTGGC CGACGACGTG ACACCCGTGG GCCTGTACCG CACGCTCGCG 
GGCGGGCGCC CCGGCACGTT CGTCCTGGAG TCCGCCGAGT CGGACGGCAC CTGGGGCCGC 
TGGTCGTTCG TCGGCGTCGC GTCGCGCGCG TGCCTGTCGG TGCGCGACGG CCGCGCCGCG 
TGGCGCGGGG ACGTGCCGGT GGGCGTGCCG ACCGAGGGTG ACGTGCTGGA TGTGCTGGGC 
CGCACCCTCG ACGTGCTGCA CACCCCGCAC GTCGACGGGC TGCCGCCCCT GACGGGTGGG 
CTCGTGGGGG TCCTCGGCTG GGACGTCGTG CGGCACTGGG AACCCACGCT GCCGGCGCGT 
GCCCCGGAGG AGCTGCACAT CCCCGAGGTG ACGCTGCTGC TGGCGTCGGA CCTCGCCGCC 
GTCGACCACG TCGACGGTTC GGTGTGGCTC GTGGCCAACG CGATCAACTT CGACGCCACC 
GACGAACGTG TCGACGAGGC CTACGCGGAC GCCGTGCGCC GTCTGGACGA GATGCAGGCC 
GCCCTGCGCC GGCCCGCACC GCCGGCACCC GCGGTCGTCG ACCTCGAGGC GCCGGTGCCC 
GAGCTGGAGT TCCGGAGCAC GCGCGAGGAG TTCGAGGCCC AGGTGCGCCG TGGGCAGGAC 
GCCATCCGCG ACGGCGAGGT CTTCCAGGTC GTCCTGTCGC AGCGGCTCGA CCTCGACTGC 
CCGGCGGACC CCCTGGACGT CTACCGGGTG CTGCGTACCG TCAACCCGAG CCCGTACATG 
TACCTGCTCG CGCTGCAGGA CGCCGACGGG CACGACTTCT CGGTCGTCGG GTCGAGCCCC 
GAGACCCTCG TCAAGGTGAC CGACGGGCAC GTCACGACGT TCCCCATCGC CGGCTCCCGG 
CCGCGGGGCG CGACGCCCGA GGAGGACCGC GCGCTGCAGG ACGAGGTGCT CGCGGACCCG 
AAGGAGAGGG CCGAGCACAT CATGCTCGTC GACCTGTCGC GCAACGACAT GGTGAAGGTG 
TGCGAGCCGA CCAGCGTCGA GGTCGTCGAG TTCATGGCCG TGCGGCGGTT CTCCCACATC 
ATGCACATCT GCTCCACGGT GGTCGGGCGG CTGCGCGCCG GGTCCACGGC GCTGCAGACG 
CTCGTGGCGA CGTTCCCCGC GGGCACGCTG TCCGGTGCGC CCAAGCCGCG AGCCATCGAG 
CTGATCGACG AGCTGGAGCC GGCCCGCCGC GGCGTGTACG GCGGCACGGT CGGGTACTTC 
GACTTCGCCG GGGACATGGA CATGGCGATC GCGATCCGCA CCGCCGTCAT CCGCGACGGG 
CGGGCGAGCG TCCAGGCCGG CGGCGGCATC GTCGCGGACT CCGTGCCTGC GCTGGAGTAC 
GAGGAGTCGC GCAACAAGGC CGCGGCGGCC GTGCGGGCCG TGCAGCTCGC CGCGCGCCTG 
CGCCGCGACC TGCCGTGA

Protein sequence

MTQPSVSAAP RATATDLPWG ATWPSRERFR ELATDRRVVP VVRRLLADDV TPVGLYRTLA 
GGRPGTFVLE SAESDGTWGR WSFVGVASRA CLSVRDGRAA WRGDVPVGVP TEGDVLDVLG 
RTLDVLHTPH VDGLPPLTGG LVGVLGWDVV RHWEPTLPAR APEELHIPEV TLLLASDLAA 
VDHVDGSVWL VANAINFDAT DERVDEAYAD AVRRLDEMQA ALRRPAPPAP AVVDLEAPVP 
ELEFRSTREE FEAQVRRGQD AIRDGEVFQV VLSQRLDLDC PADPLDVYRV LRTVNPSPYM 
YLLALQDADG HDFSVVGSSP ETLVKVTDGH VTTFPIAGSR PRGATPEEDR ALQDEVLADP 
KERAEHIMLV DLSRNDMVKV CEPTSVEVVE FMAVRRFSHI MHICSTVVGR LRAGSTALQT 
LVATFPAGTL SGAPKPRAIE LIDELEPARR GVYGGTVGYF DFAGDMDMAI AIRTAVIRDG 
RASVQAGGGI VADSVPALEY EESRNKAAAA VRAVQLAARL RRDLP