Gene Cagg_3626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3626
Symbol
ID	7269770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4405902
End bp	4406852
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	55%
IMG OID	643568433
Product	protein of unknown function DUF124
Protein accession	YP_002464899
Protein GI	219850466
COG category	[S] Function unknown
COG ID	[COG2013] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00266] conserved hypothetical protein TIGR00266

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.56616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTGTC CGAATTGTGG TGCATCAGTT ACCGCCGGTG CGCGCTTTTG TACCAATTGT 
GGCTTTCGCC TATCGACGCC GGTGCAAAGC GCACCACCGC CGCTCGTCCC GCCATCGGGT 
GAAGCCAGCA GTATGGCCGA CGTCTACGAT AATCGTCCGG GTGAACGACT CGATCTCCCC 
GAACCGCCGG TTGTCGGTTC GGGCGTGGGA GCTAGCGGTC TCCGCTTTAA GATCATCGGA 
ACAACCATGC AGGCGGTGGT GCTTGAGGTA CCACCTGGTC AGACGGTCTT TTCCGAGCGC 
GGTGGGATGA GCTGGATGAG CGCCAATGTC CAGATGCAGA CCAATATGGA AGGCGGTCTC 
GGTGGCGCGT TTAAGCGCAT GTTCTCCGGC GAGTCGATCT TTATGGTCAA CTTTACACCA 
CAAGGCGGAC CAGGAATCAT CGGCTTTTCG GCAGAGTTTC CGGGCAAGAT CGTACCGCTC 
AACCTTGCAC CGGGGCAGGT CATGATCTGC CAGAAAGATG CCTTTATGTG CGCCGAGCGT 
AGCGTTTCGC TCGACATTCA CTTCCGACGT AGGCTCGGTG CTGGTTTGTT TGGTGGTGAA 
GGCTTTATCA TGCAGAAATT GACCGGGCCG GGACTAGCGT TTGTCGAGCT TGATGGAGAG 
ATTATCGAAT ACACGCTCGA AGCCAATCAG ATGCTGAAAG TCGATACCGG CCATGTCGCA 
ATGTACGAGC CAACGGTGCA ACTCGACATC GAGATGGTGC GTGGGTTTAA GAACATTCTG 
TTCGGTGGTG AAGGACTGTT CTTGACAACC CTCCGTGGGC CAGGGCGAGT CTGGTTGCAG 
ACGATGCCGG CGATGAATTT AGCGAAGAAG ATCGCCCAAT ACTTGCCAAC ATCGAGTAGT 
TCGAGCAGTG GGGGTGGTAT TAACTTGGGA AGCCTATTTA CCAACGATTA G

Protein sequence

MNCPNCGASV TAGARFCTNC GFRLSTPVQS APPPLVPPSG EASSMADVYD NRPGERLDLP 
EPPVVGSGVG ASGLRFKIIG TTMQAVVLEV PPGQTVFSER GGMSWMSANV QMQTNMEGGL 
GGAFKRMFSG ESIFMVNFTP QGGPGIIGFS AEFPGKIVPL NLAPGQVMIC QKDAFMCAER 
SVSLDIHFRR RLGAGLFGGE GFIMQKLTGP GLAFVELDGE IIEYTLEANQ MLKVDTGHVA 
MYEPTVQLDI EMVRGFKNIL FGGEGLFLTT LRGPGRVWLQ TMPAMNLAKK IAQYLPTSSS 
SSSGGGINLG SLFTND