Gene Cagg_0161 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0161
Symbol
ID	7269076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	212979
End bp	215015
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	56%
IMG OID	643565033
Product	hypothetical protein
Protein accession	YP_002461548
Protein GI	219847115
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0126763
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGG GTCTCGGCTT ACGACTATGG TTTTTAGCCG TCAACCGGAT CGACCCGCGC 
TTTTCCGCCG CCGATGACGG CGATTATTAT GTGCGTGCGT TGCAATTTGC CGTTACCGGT 
GAATACCACG ACAACTCGTG GTTGGTACGC CCACCCGGCC ACATCTTCTT CTTTGCGGCT 
ATGCTGAAGA TCGGTCTTTG GTTGGGTGAT CCGGCAATTG GCATCTCCTT AATCCGGGCC 
GTGCAGGTTG GATTATCGCT TGCCCTGATC CCACTTGGCT ATGACATAGC GCAGCGTCTA 
TTCGACCGGC GTACCGGTGT GATCTTTGCC ACAATTCTCG CCGTTTGGAT GCCGATGGTT 
GAATTGCCGG CTCTGATACT GAGTGAGCCG CTCTTCTTCA GCATGCTGGT GATCCACGCA 
TGGATGCTCG TGCGTTGGCG TGACGAACGA CGATCAGGTT GGTTGATCGG GGCCGGTATC 
ACGCTGGCGT TGGCTGCTCT GGCCCGCTCT CCCGGTCTGT ACGGTGTACC GTTTGCGGTA 
CTGTTTATCG CTCTGAGCGC ATGGCACGCT GCGCATCAAC CGCGTCTCCG GCGTGTGATA 
CCGGCATTGC TGAGCTTCTT GTTGCCATTC GCAATAACCA TTGCGCCGTG GACGATCCGT 
AATTATCTGC TGTACCACGA CCTCATCGTG GTTGACACCC TCGGCCCGGT CAATCTGTGG 
ATTGCGATGA GCGATGCTGT GCATGAAGGG CGTGGTGAAG GCGAGGCCAA AGCGATATTA 
CTACAAATTC CACAAAGTGA GCGGCAACGA TTTGTCAGTG CTGAACTGAG ACGAATTTTA 
CAAACGGAAC CTTGGCGATT TACTCGCAAT TTCTGGCCAC ATTTTCAACA TATCTGGAAG 
GCTCAATTTA TTGAAGATTT TTTTGTTAAA GCGAGCTTCT TCACTCGTCC GTTACGCTCG 
GTGTGGCCGC TCGGGCTTAT CGGCGATCTG ATATGGTTCG CGTTTATCGT CGCTGCACCG 
TTTACGCTGC TATCACGTCT GCGCGAAGGA GCCTTCCGCA TTATTGCTCT CGGTTGGATT 
GGGTATACCT GCCTTATGGT GATGCTCACT CACGTCGAGC CGCGTTATCT CTTGCCCATC 
TGGCTCTGGT TAGCGCTGTA TGGCGCAGCA GCAGTGGCGC GAATCGGTCA ACAGCCGTTG 
CGCTTCGATC GATATAGCCG GGCGGGGTTG GCGGTAAGCT TGGCTCTGAT CGCGCTGATC 
ATCGGCTACC GCGATTACCC GCAGGTCATT CGGAACGGGA TCGCACGCGA ACAGGCGTGG 
ATGACTGCCC AACAAGCCAT CGCCCGCAAT GATCCTTCGG CGGTTGAGCA GGCATATCAG 
GCGATGTTAA CTGCCGATCC CGATTTTGCC GATGGACGTA CCGATTTTGC CCGTTGGCTT 
CTTGCCCAAG GTCGCTACGA TGAGACATGG CAGGTGATCG GTGATTACCA AACCCACCGT 
GGTAATTTAA TCCGTGGGGC ATTAGCTCGT GCCCAAGGTG ATGCCGAAAC GGCAAGGTTG 
CTTCTGCGCA ATACTGAAGA GTTGGGCGGT GAGGATGTTC AGCGGCTAGC CTTGGAGTGG 
CTTTCACCAT CGCCCACGTC TGTTCTTACC CTCGGCAACG ATCTCGACCT CGGTTACGTG 
ATGGGATTTG CCCTCGGTGA ACGGGTAGGT GATACGACGT TTCGCTGGTT ACAACGCGAG 
GGTGTCATTC GTTTGCCGGT ACCGACCGCG CTGACCGGCA CCGAGATCAT CGCGCTACGG 
CTCGCTGCCC CCCAACCAAC GCCCCTCACA GTAATGGTCG GTTCCCAGGC ATACCAGATC 
AACGTTGTAC CGGGCGGTTG GCGGGTGTAT CTTCTCCCCC TCCCGGCAAC CACCCGAGGT 
ACCGATGAAG TGGTCATCAC GCTACAGGCG CCGACGTTTG TACCGTACCG TCAATTTGCC 
GATAATGCCG ATGCACGCCC GCTAAGCGTG ATGGTAAACC AAATAGCCAT ACGATAA

Protein sequence

MLLGLGLRLW FLAVNRIDPR FSAADDGDYY VRALQFAVTG EYHDNSWLVR PPGHIFFFAA 
MLKIGLWLGD PAIGISLIRA VQVGLSLALI PLGYDIAQRL FDRRTGVIFA TILAVWMPMV 
ELPALILSEP LFFSMLVIHA WMLVRWRDER RSGWLIGAGI TLALAALARS PGLYGVPFAV 
LFIALSAWHA AHQPRLRRVI PALLSFLLPF AITIAPWTIR NYLLYHDLIV VDTLGPVNLW 
IAMSDAVHEG RGEGEAKAIL LQIPQSERQR FVSAELRRIL QTEPWRFTRN FWPHFQHIWK 
AQFIEDFFVK ASFFTRPLRS VWPLGLIGDL IWFAFIVAAP FTLLSRLREG AFRIIALGWI 
GYTCLMVMLT HVEPRYLLPI WLWLALYGAA AVARIGQQPL RFDRYSRAGL AVSLALIALI 
IGYRDYPQVI RNGIAREQAW MTAQQAIARN DPSAVEQAYQ AMLTADPDFA DGRTDFARWL 
LAQGRYDETW QVIGDYQTHR GNLIRGALAR AQGDAETARL LLRNTEELGG EDVQRLALEW 
LSPSPTSVLT LGNDLDLGYV MGFALGERVG DTTFRWLQRE GVIRLPVPTA LTGTEIIALR 
LAAPQPTPLT VMVGSQAYQI NVVPGGWRVY LLPLPATTRG TDEVVITLQA PTFVPYRQFA 
DNADARPLSV MVNQIAIR