Gene Cagg_1837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1837
Symbol
ID	7267749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2253845
End bp	2254927
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	56%
IMG OID	643566673
Product	aminodeoxychorismate lyase
Protein accession	YP_002463168
Protein GI	219848735
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCATG TCCGCGCCCT CTTACTCGGT CTTTCTCTCC TGGCACTGGT AGTCTCGTGT 
GCGGGTTATG TCTTCTTGAG TGAATTGCGG GCGACACCGG CGACTACCAA CACACCGGTT 
GAGTTTATCG TCGCCCCCGG TGAAACAACC AACGATATTG CGAATCGGTT GGCCGAAGCC 
GGTCTGATCC GCCAACCGGC CCTCTTTCGC GCACTGGTCC GCTGGCGCGG TCTCGATCAG 
CAGATACAGG CCGGGCGCTA TGTACTCAGC CCGACGATGA CAATGAGCGA GATTCTGATC 
GTCTTACAGA GCGGAAAGGT GGTCAACGAT ATTCAGATCA CGATCCCGGA AGGATTGCGT 
CTCGAAGAGA TCGCTGCGAT TATCGCCGCT GCCGGCCTCG TGAGCGAAAA CGATTTTTTG 
ACCGTTGCAC GTGACGGCGA CCGATTCCGT GCAGATTATT TTCTGCTTAA TAGCTTGCCG 
GAAGGGGCGA CACTCGAAGG CTATCTCTTC CCCGATACCT ATCGGTTTGC ACCCTCGTCT 
GATGCCGAAA CCATCGTGCG TAAGCTACTC GACCGCTTTG TTGAGCAGTA TAGTACGATT 
GAGCGTTCGG TCCGGGTACC GGGTGTTACC GTCCATCAGA TCGTCACAAT GGCGTCGATT 
GTCCAACGTG AGGCAGCTCT CCTCAGCGAG ATGCCACGTA TTAGCGCGGT CTTCTGGAAT 
CGTCTCAAAC CGCAATATGC CCCCATCTTC GGCGGGGGGT TGCTCGGCGC CGATGCGACG 
GTACAGTATG CGATTGGCTA TGATCCCGGT GAAGGTACGT GGTGGAAACG TAATCTGACC 
GTTGACGATC TGGCGATTCA AAGCCCGTAC AATACGCGCA TCAATCCCGG TTTGCCACCA 
GGCCCAATTG CTGCTCCCGG CCTTGCTGCG CTCACGGCTG CGGCTCAGCC CGATGAATCG 
TCGCCCTATC TGTTTTTTGT CGCCAGTTGC GAGTTTGATG GTTCACATAA GTTTGCAACG 
ACTATCGAAG AGTTTCGTGT CTATGAAGCG GAGTGGTTGG CGTGCCAGCA GAATCGACCC 
TAA

Protein sequence

MRHVRALLLG LSLLALVVSC AGYVFLSELR ATPATTNTPV EFIVAPGETT NDIANRLAEA 
GLIRQPALFR ALVRWRGLDQ QIQAGRYVLS PTMTMSEILI VLQSGKVVND IQITIPEGLR 
LEEIAAIIAA AGLVSENDFL TVARDGDRFR ADYFLLNSLP EGATLEGYLF PDTYRFAPSS 
DAETIVRKLL DRFVEQYSTI ERSVRVPGVT VHQIVTMASI VQREAALLSE MPRISAVFWN 
RLKPQYAPIF GGGLLGADAT VQYAIGYDPG EGTWWKRNLT VDDLAIQSPY NTRINPGLPP 
GPIAAPGLAA LTAAAQPDES SPYLFFVASC EFDGSHKFAT TIEEFRVYEA EWLACQQNRP