Gene Cagg_3224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3224
Symbol
ID	7267371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3908284
End bp	3909243
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	59%
IMG OID	643568045
Product	Inosine/uridine-preferring nucleoside hydrolase
Protein accession	YP_002464518
Protein GI	219850085
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00529527
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.234301
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTCCA CTGCACGCCG GATCATCCTC GATACCGACC CTGGCATTGA TGACGCGCTC 
GCGATCTTGC TTGCCCTCGC CTCACCCGAA ATCGAACTCA TCGGTCTCAG TGTGGTTCAC 
GGCAACTGCA CGCTGGCCGA GGCCGTTGCC AATGGGTTGG CCGTACTGGA ATTGGGCGGC 
GGTCACCACG TGCCGCTCTT TGCCGGTTGT GACCGGCCAT TATTGCGCCC ATTGACCACA 
GCCCACGACA CGCACGGTCA AAGTGGGCTT GGCTATGCCC ACTTGCCGAC AGCCACCATT 
CAGCCGGCGC CGGGGCACGC GGTGGATTTT ATCATCGACA CCGTATTGGC GGCGCCCGGT 
GATGTGACCC TCGTGGCGGT GGGGCCACTC ACAAACGTTG CGCTAGCACT GCGGAAAGAG 
CCACGTCTGG CCGGTGCATT GCGTGAAATT GTGATGATGG GTGGTGCGTT GCGTGCCGAT 
GGTAATGTGA CACCGCGGGC CGAGTTCAAC GTTTTCGCCG ACCCCCACGC GGCGCAGATC 
GTCTTTTCGG CGGGGGTACC CTTAGTGATT ATGCCGTGGG ATATTACCCG ACTCGTGCGG 
TTGCACGAAA GCGAAGTGCA GCGGTTGGCG GCGTCTGGCA AGCCCATCGG GCAATTTATT 
GCCGACGCGA CTCGCTTCTA CATCGAGTTT CACCGTCGGT ATTTCGGGTA CGACGGTTGT 
GCTATCAACG ATCCGGCAGC GTTGGCACTC GTGTTCTACC CTGATTTGGC AACATATGCC 
GATGTGTTTG TAACGGTGGA GACGTGTAGC CCGCTGACGA TGGGGTTTAC CGTCGCAGAT 
TTTATGCTGA GTGATGGCCG TCGTCCGAAT GCGCGTGCGG TAGTGGCCTT TGATACGCCG 
CGCTTCCTCT CCTTGTTCAC CGAGCGTATG CAAGCCCTTG AGCGACGGTT GTACGGGTGA

Protein sequence

MSSTARRIIL DTDPGIDDAL AILLALASPE IELIGLSVVH GNCTLAEAVA NGLAVLELGG 
GHHVPLFAGC DRPLLRPLTT AHDTHGQSGL GYAHLPTATI QPAPGHAVDF IIDTVLAAPG 
DVTLVAVGPL TNVALALRKE PRLAGALREI VMMGGALRAD GNVTPRAEFN VFADPHAAQI 
VFSAGVPLVI MPWDITRLVR LHESEVQRLA ASGKPIGQFI ADATRFYIEF HRRYFGYDGC 
AINDPAALAL VFYPDLATYA DVFVTVETCS PLTMGFTVAD FMLSDGRRPN ARAVVAFDTP 
RFLSLFTERM QALERRLYG