Gene Cfla_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cfla_1820
Symbol
ID	9145713
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cellulomonas flavigena DSM 20109
Kingdom	Bacteria
Replicon accession	NC_014151
Strand	+
Start bp	2029831
End bp	2031036
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	70%
IMG OID
Product	aminodeoxychorismate lyase
Protein accession	YP_003636916
Protein GI	296129666
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.111847
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.624649
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAACC AGACGGAGTG GTGGGCCCCG GTGAAGTCCG ACGAGAGCGT GACCGACCTG 
TTCGGCGGTG AGCGCGTCGC GGCGGCGCCG GGTGCGCCCG AACCGCGACG ACGGTCCCGC 
TCGTCGGGCC GCAAGCGTGA GGAGCGGATG CGCAAGCAGC GCCGCCGCCG GTCGGTCTCC 
GTGCTCGTCG TCGCGCTCGT GCTCGTCGCC GGCGCCGGAT ACGTCGTCTT CTCGCTGCTG 
GGAGGCCAGC TGTTCGCCGG GTCCGGCCAG GAGCGCGTGA CCGACTACCC CGGTGCCGGG 
CGCCCCGGGG CGCCCACGAT CGTCATCAAC GCCGGTGACA CCGGCGCAGC GATCGCTGCG 
ACGTTGTACG ACGCCGGCAT CGTCGCGTCC GAGGCGGCGT TCCGCGAGGC GTTCGACGCC 
AACCCCGACG CGGCCGGTAT CCAGCCGGGG ACCTACCAGC TCAACCTCGA GATGAACGCC 
GAGCGTGCGG TGCTGGCGCT GCTCGACCCG AAGAGCCGCA AGTCCATGAA GCTCACGATC 
CCCGAGGGCT GGACGGCCGA CGAGATCTTC GCGCGCATCA ACGAGGTGAC GCTCGTCCCG 
GTCGAGGAGC TCAAGGCTGC GGCGTCCGAC CCTGCCGCGA TCGGACTGCC CGCCGAGGCG 
GGAGGCAACC TCGAGGGCTG GCTCTTCCCG ACGACCTACC AGGTCGAGCC GAACCCGACG 
GCGCAGTCCG TGATCGCGCC GATGGTGGCC AAGACCGTCG AGACGCTGAC GTCGAAGGGC 
GTCCCCCAGG ACCAGTGGCT CGACGTCCTG AAGAAGGCGT CGCTCATCGA GAAGGAAGCG 
GTCCTCGACA GCGACCGGCC GATGATGGCC CGCGTCATCG AGAACCGGCT CGCGCAGGGC 
TGGCCCCTGC AGATCGATGC GACGCTCGTC TACGCCCTCA AGAAGCCCGG CAACGAGCTG 
ACGCAGGCCG AGCTCGAGGA CACGTCGAAC CCGTACAACT CCCGCAAGCT CAAGGGGCTC 
CCCCCGACGC CGATCGCGTC GCCGGGCATC CCCTCGATCG AGGCGGCGCT GGCACCCGCG 
GCCGGGGACT GGATGTTCTG GGTGACGGTG AACCTCGAGA CCAGCGAGAC GAAGTTCGCC 
ACGACCCACG ACGAGTTCCT CGAGTACAAG GCCGAGTACC AGGCGTGGGT GGAGGAGAAC 
CGCTAG

Protein sequence

MSNQTEWWAP VKSDESVTDL FGGERVAAAP GAPEPRRRSR SSGRKREERM RKQRRRRSVS 
VLVVALVLVA GAGYVVFSLL GGQLFAGSGQ ERVTDYPGAG RPGAPTIVIN AGDTGAAIAA 
TLYDAGIVAS EAAFREAFDA NPDAAGIQPG TYQLNLEMNA ERAVLALLDP KSRKSMKLTI 
PEGWTADEIF ARINEVTLVP VEELKAAASD PAAIGLPAEA GGNLEGWLFP TTYQVEPNPT 
AQSVIAPMVA KTVETLTSKG VPQDQWLDVL KKASLIEKEA VLDSDRPMMA RVIENRLAQG 
WPLQIDATLV YALKKPGNEL TQAELEDTSN PYNSRKLKGL PPTPIASPGI PSIEAALAPA 
AGDWMFWVTV NLETSETKFA TTHDEFLEYK AEYQAWVEEN R