Gene Cagg_3703 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3703
Symbol
ID	7268239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4499626
End bp	4501098
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	55%
IMG OID	643568510
Product	metallophosphoesterase
Protein accession	YP_002464975
Protein GI	219850542
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000500405
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCCGACCA AAACCAACAA CTCATCTTCC CAGCATGCGC AAGCGAGAGT CTTTGCAGCA 
AGGTATGTAC AGCGAATTGT ACGATGGTGG CTCGCCCTGT TGATCCGGCT AACCATTGCT 
GTTGCCCTCC TGTTCGCTTT CCGCTGGATC GTGCTACGCT TTCGACGTGT GCGCATTCGT 
CCTACCTCAT ATGCAACACC CCCAATCGGA CCAGAAGAGA TTGACACTCA GCGCCGACGA 
ATTGTGATGA GTGATCTTCA TCTCGGTGGT GGCGATCGGC GTGATGACTT TTGTGATGAT 
GAAGCCCTGA TTGCCTTCAT CGAACAGTAT GTCATGCAAG AACCAACCGA ACTGATCCTT 
GCCGGCGACA CCTTCGAGTT TTTACAGGTC AGCCTGCCCG ATGTCGCTGA TGATGAGTGG 
TCGCAACGGG CTGCCGCGCG ACGGTTGCAA GCGATCATTG AGGCACACTC CGGCGTAATT 
GATGCGCTGC GCCGATTTGT CCAACCAACT GATAACCGGT TGACCATCTT GATCGGCAAT 
CACGACTTTG AATTGCATTA CCCGGCAGCG AAAGAAGTCT TGCGACAGGT ACTTCACCTA 
CCGGCCAACG ATCCGCGGTT GCGGTTTGGG ATCAGTTATC ACGGTGGCGG TGTCTATATC 
GTACACGGTA ATCAGTTTGA CCGGTGGAAT CGGTTCGTCA ATTTTGCCGG TATCAGCGAA 
CCGTTCGAGG TGGTACGCGG GACACAGTTG GTCAAAGAGG TCATCAACGA GCTTGAAGAA 
GATCCGTTCC CGTTAGCCCC CTTGATCGAC AACATTAAGC CATCGTCAGC CTTCTTCTGG 
TATCTGATGA GTTTGCAACG ACTGCGTGAT CCGGCAGCAC GACGTTTTGT GACCCGCGGA 
GTGATCGGTT TCTTGCAAGT TACGGCGTGG GCACCGCCAC ACCATCTGTC GAGTGAACCC 
GACGAATGGT TACGACGCTC GCCGTTGCTG GCGCTGTGGC AACCGATTGC TGCATTTCGT 
CGCCAGCGTG TTACTCGCCA TCAAGCAATT GCGCGCCAGC TTGGTGCTGC CGCAGAGGCA 
TTCAGTGGTT TACCCGAAGT GGTTGATCAG GTACGTGACG AAGCCCGTCG GCAAGCCAGT 
CGTGAAGTGA GTACCTTCAA CGATGAGATC GCACGGGAGA TGGCGCTCAT CGCTCGTCTA 
CCGGCCTATC GTAACGACCA CCTCTTTGTG TGTGGTCACA CCCATTTGGC TCGCGTGATC 
GAGCTAGGCG AGGGACGGCG CTATATCAAC GTTGGCACAT GGACAGACAT TGTGTTTGAC 
GTAGAGACGA TGCGTCGGCC TAGCCAGCGC TATCCATTTC TCGAGATTCC CAGCGGTGAA 
GATGGTGCGC ATCGCGCGCA GTTGTTGGTC TGGCATGGGG TCGATCAACC ACCATACCCA 
TGGCACGAAG AAGAGCCGCC GCGCCAGCGT TAG

Protein sequence

MPTKTNNSSS QHAQARVFAA RYVQRIVRWW LALLIRLTIA VALLFAFRWI VLRFRRVRIR 
PTSYATPPIG PEEIDTQRRR IVMSDLHLGG GDRRDDFCDD EALIAFIEQY VMQEPTELIL 
AGDTFEFLQV SLPDVADDEW SQRAAARRLQ AIIEAHSGVI DALRRFVQPT DNRLTILIGN 
HDFELHYPAA KEVLRQVLHL PANDPRLRFG ISYHGGGVYI VHGNQFDRWN RFVNFAGISE 
PFEVVRGTQL VKEVINELEE DPFPLAPLID NIKPSSAFFW YLMSLQRLRD PAARRFVTRG 
VIGFLQVTAW APPHHLSSEP DEWLRRSPLL ALWQPIAAFR RQRVTRHQAI ARQLGAAAEA 
FSGLPEVVDQ VRDEARRQAS REVSTFNDEI AREMALIARL PAYRNDHLFV CGHTHLARVI 
ELGEGRRYIN VGTWTDIVFD VETMRRPSQR YPFLEIPSGE DGAHRAQLLV WHGVDQPPYP 
WHEEEPPRQR