Gene Cagg_2572 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2572
Symbol
ID	7267161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3134768
End bp	3136825
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	57%
IMG OID	643567396
Product	hypothetical protein
Protein accession	YP_002463877
Protein GI	219849444
COG category	[R] General function prediction only
COG ID	[COG1287] Uncharacterized membrane protein, required for N-linked glycosylation
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCCG GCAAACTCAC TTCCTCGCGC ACAACGATCT GGCTGGCAGC AATTTGGCTG 
GCGGCAATGA TCAGCATAGC CGTACCGGGA TTGCTTTGGT GGCTACCGTG GTCATTCTTC 
AGCACGCCAT TGGTCGTAAT CAGCGGCGGG ATGCTGTTTA CCCTACCGGG GTTAGCCCTC 
TTACGTTGGC TCCACCCTAG CCCGTTGCAT GGGTTTGAAC GCCTGGCATA CTCGGCAAGT 
CTGAGTTGCG CGGTCCTTCC TCTCATTCTC CTGTTTAGTG AACCTATCGG CTGGCGCTGG 
AATGGACTGT CTGCCTGGTT GGTTATCGGT GGCTGTGCGG TACTGGCCTT GTGGCCGCAG 
ACATCGGCGA TACGCCGAAC CGCTCCCGCT TCAGGCAATT GGCGACAAGC TGCTCTACCA 
ATTCAACCAC GCCACCATCT GATCGGATGG GTGTTGATCT TTCTAACCGG TGCAGCCTGT 
GCGGTACGCT TGTTTCTTGT ACGTGATGTA CCGCTTGGGT TTTACGGCGA TTCGTATCAT 
CATACGGTGA TCACCCAGCT CCTCATCGAC CACGGCGGCC TGTTCCGATC ATGGGAACCT 
TATGCTCCTG CCGTCACCTT CACCTATCAC TATGCGTTCC ACGCGATGGG TGCCTGGTGG 
CATTGGCTCG CCGGTATCCC GGCAACCCAA GCGGTGATCT GGACGGGACA GGTGATGAAT 
GGTTTGGCAG TCCCGCTGAT GTATTTGCTG TCCACTCGTC TTACCAATTC ACGTCTGACC 
GGTTTGTGGG CGGCTGTGAT CGTGGGCTTT GTGAGTGTGT ACCCGGCTTA TTACGTCAAT 
TGGGGACGCT ACACACAGTT AGCCGGTCAG ACGGTACTAC CGGCGGCGGC GATGGCTTGG 
CTGACGGTGA TCGATGGTGC ATTGCACCTA CAACGGTCAT GGAGACAGTT AGCGCACCAG 
TTGGTCCTGG CAATAATCAC CGGTGCCGGC CTGGCGGTCA GTCATTACCG GGTAGCGATC 
CTTGCGATCT GCTTGCTGGT GGCCTACACG GTAACGGTGC TCGTGACGGC TTGGCCAATC 
GAACGTCGAT CATTGATCCG CTTCCTGACG GTAGGAGCCA TCGGTGCTAT CGGCGCACTG 
CTGCTAGCAT TACCTTGGCT CTGGCGAGTA CGAGAGGGGC AGATCACGCG ACTGGCTACG 
AACCTCGTCC TCAACAATAG TGAAGCCAGT AATCCTTTTT CACCCGAAAC CGTCGGGGCA 
GCATTTCAGC ATGGTCTCTT CCCTTTGGCC GCGTTGGGCT TGGGTAGTCT GCTCTGGCGA 
CGACAGCTCG GTGGGATTGT GCTCGCGCTC TGGGCCGGTT TCGCATGGGT GGCCGCTAAC 
CCGCAATTGA TCGGCTTGAA CGGACAGGGT TTGATTACTT CATTTACCGT CCTGATCGGT 
GCGTATATGG CGATTGCACC GGCTGCCGGT GCGGGTATCG TGGCGCTGTT CAGGCTGATC 
GCACGCCTGA TGATCACCCT GCCTCGTCAC GCTGCAACTG CACTCGTTGC CGTCCACCTG 
GGGAGTGGTC TCCTCATTGT CGGGTGGGGA TCGTATTTTC AGGCGACGAT CCTCGATCCG 
GCCTACCAAC TTGCCACCCC TGCCGATCTG AAAGCCGCAG CATGGATTCG CGATCATCTC 
CCACCAGATG CAGCGGTTTT CGTTAACGGG TTTGCAGCCT ACGGTGGCTA TGTTTACGCC 
GGTAGCGATG GGGGCTGGTG GTTGACCTTG CTGACCGGAC GACGAACTAA TCTGCTGCCG 
ATGGCCGTCG GTTTTGAGGC AATCGATCCA CCAAACATGT TGCAGATCAT TCGCGAGCAG 
CATCAGGCCG TACAACAGTT TCCCATTGGG AGTGCAGAAG CGGCAGCAGC GCTCCGCTCA 
CTTGGTTTTG CGTATCTGTA CAATGGCCCG GCGGCTAATC CGCCCGGCGA ATATCTCGAT 
CCGGCGCAAA TTGACGCCAC ACCGTTGTAT GAGCTTATCT ATCGCCAAGA TGGCGTGAGT 
ATTTGGAGAA TCCGCTAG

Protein sequence

MIAGKLTSSR TTIWLAAIWL AAMISIAVPG LLWWLPWSFF STPLVVISGG MLFTLPGLAL 
LRWLHPSPLH GFERLAYSAS LSCAVLPLIL LFSEPIGWRW NGLSAWLVIG GCAVLALWPQ 
TSAIRRTAPA SGNWRQAALP IQPRHHLIGW VLIFLTGAAC AVRLFLVRDV PLGFYGDSYH 
HTVITQLLID HGGLFRSWEP YAPAVTFTYH YAFHAMGAWW HWLAGIPATQ AVIWTGQVMN 
GLAVPLMYLL STRLTNSRLT GLWAAVIVGF VSVYPAYYVN WGRYTQLAGQ TVLPAAAMAW 
LTVIDGALHL QRSWRQLAHQ LVLAIITGAG LAVSHYRVAI LAICLLVAYT VTVLVTAWPI 
ERRSLIRFLT VGAIGAIGAL LLALPWLWRV REGQITRLAT NLVLNNSEAS NPFSPETVGA 
AFQHGLFPLA ALGLGSLLWR RQLGGIVLAL WAGFAWVAAN PQLIGLNGQG LITSFTVLIG 
AYMAIAPAAG AGIVALFRLI ARLMITLPRH AATALVAVHL GSGLLIVGWG SYFQATILDP 
AYQLATPADL KAAAWIRDHL PPDAAVFVNG FAAYGGYVYA GSDGGWWLTL LTGRRTNLLP 
MAVGFEAIDP PNMLQIIREQ HQAVQQFPIG SAEAAAALRS LGFAYLYNGP AANPPGEYLD 
PAQIDATPLY ELIYRQDGVS IWRIR