Gene Cagg_2400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2400
Symbol
ID	7267228
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2917332
End bp	2918894
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	57%
IMG OID	643567226
Product	TPR repeat-containing protein
Protein accession	YP_002463709
Protein GI	219849276
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.38799
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATCGA CCAACGAGCT TCAATTTATG CCCCTCGACC TCGATACCTT CAGCGGTAGC 
GAGCGCTTCA TGAGCGGCAC CCGCCTAGGG GCAGCGTTCA GTCAAGGAAT GCGTTCCTAC 
CTACGCGCGG CCTACGCCGA TGCGATCGAG CATTTCAAGG CTGCTCTCAT CGCCGCCTAC 
GTTGATGGGG AAGAGCAAGC CCAGATTTAC GAGCGCGAAC GGGCAATTAT CTATCTCTAT 
ATCGGCAACT CACTCGCCTT CCAAGATCAT TGGGAAGAGG CACTGCGCGA GTATCTCGAA 
GCGGTACAGA CCGATCCGCA ATTAGCTGAG GCCCACTACA ATCTCGGCGT CGCCTTTGCC 
GCCCTCGGCC AAATCGACCG AGCCATCGCC GCCTTCAAAG AGACGCTCGA ACACAACCCC 
AACCTCTACG AGGCCCATTT CGCGCTTGGT CGCTGCTACC AACGCATCGA CGATGCCGGT 
CGGGCGTATA TTCACTTCAG TAGCGCCTGC AACGCGCGCC CACAAGCTGC CGAGCCACGT 
TACTACATGG GCTTGATGCA CCAAAGTCAC GGCGCGCACG AGCTTGCACA ACGGTGCTTT 
GCCGAAGCGC TGCGCGTTGA ACCGACGTTT GTCTCACCCG AACCATTACC CGACGAGCCG 
CTCGTCAACC GTAGCGAAGA AGAGGTGGCC CAGTGGTATT ACCGGCTTAG CCAGGCCCTC 
AAGCAACAAG GATATGAAGA AGAGGCCGAG CGGATCTACC GTGCTTTACT CCAATGGCGC 
CCCCAAGAGT ATGCTGCCCG TTATCTCCTG GGGAACCTCC TGGCCCGTCA ACGTCGGTTT 
GACGAAGCCT ACGCCGAATA TGAGCAAATA CCACCGCAAC ATCGCCATTA TGTCGATGCA 
CGTCTCCGCA TGAGCGCCAT CTTGCGTTTG CAAAAGAAGC CCAAACAGGC CTACGAAATC 
CTTTTCGCCT GCGCCCGGCT TAATCCGCAC CACGGCCAGC TCTTCTTGCA GATGGGCAAA 
CTCCTTTACG ATATGGGAAT GACCAGGCAA GCGGTCCGTG CCTTCGAGCG AGCCGTTCAA 
TTGCTCCCGA CCGATGCTCA AGCTCATTAC CTCCTTGGAT TTGTGTACAA TACGATGGGG 
CGCGACACGT GGGCACTCGC TGCTTGGCGC AAAGCCGTGC AGCTTGCCCC TGATGCGCAT 
TCACTACGCT TTGATCTTGG CTACATGTAT ATCCGGCGTG GGCGATACGA TCTTGCAGCG 
AAAGAGTTCC AGCAAGTACT CGAACAGTGG CCCGACGATA TAGAAACGCA GTTCATGCTC 
GGATTATGCT ACAAAGAGCT GCTCGAACCG TCGCGCGCTA TCCCACTGTT TGAAAAGGTG 
CTTCGCCGCA ATCCACGTCA CGCTCAGGCT CTCTACTACC TGGGTGCATG CTACCTCCAA 
GTCGGCAACA CCTCTCTCGG CAAGGCGTAC CTGCGTCGGT ACGATCATCT TATCCGTCAA 
ACCGAAACAA CGAACGGCAG TCGGTCGCGA TCACTACCCA AACCACAGTT GTCTTCACCA 
TAA

Protein sequence

MASTNELQFM PLDLDTFSGS ERFMSGTRLG AAFSQGMRSY LRAAYADAIE HFKAALIAAY 
VDGEEQAQIY ERERAIIYLY IGNSLAFQDH WEEALREYLE AVQTDPQLAE AHYNLGVAFA 
ALGQIDRAIA AFKETLEHNP NLYEAHFALG RCYQRIDDAG RAYIHFSSAC NARPQAAEPR 
YYMGLMHQSH GAHELAQRCF AEALRVEPTF VSPEPLPDEP LVNRSEEEVA QWYYRLSQAL 
KQQGYEEEAE RIYRALLQWR PQEYAARYLL GNLLARQRRF DEAYAEYEQI PPQHRHYVDA 
RLRMSAILRL QKKPKQAYEI LFACARLNPH HGQLFLQMGK LLYDMGMTRQ AVRAFERAVQ 
LLPTDAQAHY LLGFVYNTMG RDTWALAAWR KAVQLAPDAH SLRFDLGYMY IRRGRYDLAA 
KEFQQVLEQW PDDIETQFML GLCYKELLEP SRAIPLFEKV LRRNPRHAQA LYYLGACYLQ 
VGNTSLGKAY LRRYDHLIRQ TETTNGSRSR SLPKPQLSSP