Gene Cagg_1995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1995
Symbol
ID	7268911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2438346
End bp	2439521
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	56%
IMG OID	643566826
Product	protein of unknown function UPF0052 and CofD
Protein accession	YP_002463319
Protein GI	219848886
COG category	[S] Function unknown
COG ID	[COG0391] Uncharacterized conserved protein
TIGRFAM ID	[TIGR01826] conserved hypothetical protein, cofD-related

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0160004
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAACA TCTTTAACCG TCTCAATGCG CTGCGCTACC TCATCCCATC CCTCTCCCTC 
ACCTTCGCCG GTGTCGTGTT GTTGTCGCTC GGTGTTGCCT ATCTGTTTAT TCACGCCTAC 
CGCACTGTTG AAGGATTGCC CGATGTTGTC TGGTGGCTAA CGCTCCAATT CCTTCCCCGT 
CCGTGGCGGG GGGTCTTGTT GCTTGGCGCC GGTTTGGCCG TCTTGGCCGG TGGGATCTGG 
CAATTGAGCG GTGTCGTGGT GATCCCGCGT CCTAGTCAAT TACCTGCCGA TGGCGAACTG 
GTGTTAGGCT ACGACCGCGC CAAACGACCG CGCCGGATTG CAGTGATTTC GGGTGGCGCC 
GGCATGCTGG TGTTATCGGG CTTGAGCGAA CAGGTTGATC GCATGACCTG CATCGTTCCG 
GTCACCGATC CAGTAGAGTA CTATTATCGG GCTTCGGGAT TGCTCAATCA ACCAAATGTC 
TACTACGTGG TGCCAACGCC GATGCCACTC GAAGTCATTG CCGAACTTGA CGATAGTACG 
CTGATAGATG TGCGGCACAT CCACCTACAT CCCGAATTGG CCGATCGGCG GGTGCAGCGA 
TTGCGTTTGA CACAAGCCAA CCCACCGCCG TTAACTCGAG TAACGGTGGA GGCCTTGCAA 
GAGGCCGATG CGATTGTGTT GGGGCCGGGA AGCCTGTTTG AAAGTATTCT GCCGAATTTC 
TTGCTGGCCG AGTTTGCCGA GGCAGTGCGC AAGAGTCCGG CCAAAAAGAT CTTTGTCTGC 
AATCTCATGA CCGAGCCGGG ACGAACGACC GGCTTTCGCG TGGCCGATCA TATTCGGGCA 
ATTAAGGAGT ATGCCGGGAT TACCCCAGAT TATGTGTTGG TGAATGCACA ACGGATCGAT 
CCAGAAACGA CACGTATTTA TGCCGCTGCC CATCAATCGC CGGTCTATCT CGACCCTGGC 
GATTACGAAG AGTTGGCGAC GTTGCCGGGT GATGTACATG GCCGGCGTGG AGTGATTATC 
GAAGGAAGTA TGGTAATCGA GGCTGATCTG TCGGCTGCGG TGATCCAATA TACGACCTCA 
CTTGACAATC CACAACAGAG TCGCGCAGTC CGGGTATTGC GCCACGATGG TCAAAAGCTG 
ACGGCAGCTC TGCTCGAATT GTTGCGGCGG GTGTGA

Protein sequence

MKNIFNRLNA LRYLIPSLSL TFAGVVLLSL GVAYLFIHAY RTVEGLPDVV WWLTLQFLPR 
PWRGVLLLGA GLAVLAGGIW QLSGVVVIPR PSQLPADGEL VLGYDRAKRP RRIAVISGGA 
GMLVLSGLSE QVDRMTCIVP VTDPVEYYYR ASGLLNQPNV YYVVPTPMPL EVIAELDDST 
LIDVRHIHLH PELADRRVQR LRLTQANPPP LTRVTVEALQ EADAIVLGPG SLFESILPNF 
LLAEFAEAVR KSPAKKIFVC NLMTEPGRTT GFRVADHIRA IKEYAGITPD YVLVNAQRID 
PETTRIYAAA HQSPVYLDPG DYEELATLPG DVHGRRGVII EGSMVIEADL SAAVIQYTTS 
LDNPQQSRAV RVLRHDGQKL TAALLELLRR V