Gene Cagg_3786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3786
Symbol
ID	7267860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4618757
End bp	4619917
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	50%
IMG OID	643568594
Product	protein of unknown function UPF0118
Protein accession	YP_002465058
Protein GI	219850625
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.262236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0203414
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACATG ACGCACGGCC GATCCGCTTT TCTTATCAAG CAAAATGGAT TACAAGCGCA 
ATTGTTGTTG GGTTAATAAT CGTTTTCTTG CACGAGATTA CGCATATTTT GCCGCCGTTC 
ATCGGAGCAA TTATTACGGC GTATCTGTTT AACCCACTCA TCGGTTGGTT GCACCGGCGT 
ACCGGCATTA GTCGGGCGAT CTGGATTGTG ATCTTGTATG TTGTGGCCGG TTCGGTGCTC 
TATAGTCTAT TTACCGCTCT CTGGCCGCGC ATCGTGCAAC AGAGTCGCGA TTTGGCGGCG 
AGTGCGCCGA TGATTATTCG TGAATTGACC ATCTGGTTTG AGCAGAATGA ATCGATTGTT 
CTTGGCGATA TGGTGATTAG CCTTGCTCCG CTCGAGGCAC AGGTGATCGG GTTGATCAGC 
GATGTTGCCG GTTGGTTGAG CGGGAATGTG CCCAAGATTG TCTTTTCGGC GCTCGAAAGT 
GTGATTTATC TGTTGGTCTA TTTGATTATT ACATTTTATC TGTTGTTACA AGCACCACAG 
TTGAAGGAAT GGGCACGGAA TCTCATCCCA TCACCCTACC GACGTGAAAT TGCTCATCTC 
GGCTATCAAA TAGATCGCGT GTTTAATGCC TATATTCGAG GGCAATTAAT TCTCATCGTG 
ATCATGTCGG TTCTGCTCTA TATTCCGCTC TCGATTTTGC AGGTACCATA CGCACTCGTG 
ATCGCGATTG CCTCCGGTGT GCTCGAGATT TTACCGATTA TCGGGCCGTG GTCGGCAGCC 
GGGATTGCGA TGACGGTGGC GTTGTTTCAG CCGGTGACAC CGTTCGGGCT GTCGAATGTC 
TCATTGGTGA TTCTGCTCGG TGTTATTTAT TTCGTGTTAC GCCAGATCGA GGATCATTTT 
ATTATTCCTA ATGTTATGGG GCCATTGGTG CGTTTGCATC CGGGTGTAGT TATCTTTGCC 
ATTCTGGCCG GCGGTGCTTT GGCCGGTGCA TTTGGCCTCT TTATCTCGAT CCCAATCGCG 
GCTGTCATTC GGATTATCCT CAGTTATCTC TATCGGAAGT TGACCGATCA GCCCGAACCA 
CCGGCGAGCG CCGATCTTCC CAACCCACCT CCTCAGGGTG AGCCGGCGGT CGGTGAGGCT 
GCGCTGAGTT CACAAGGATA A

Protein sequence

MEHDARPIRF SYQAKWITSA IVVGLIIVFL HEITHILPPF IGAIITAYLF NPLIGWLHRR 
TGISRAIWIV ILYVVAGSVL YSLFTALWPR IVQQSRDLAA SAPMIIRELT IWFEQNESIV 
LGDMVISLAP LEAQVIGLIS DVAGWLSGNV PKIVFSALES VIYLLVYLII TFYLLLQAPQ 
LKEWARNLIP SPYRREIAHL GYQIDRVFNA YIRGQLILIV IMSVLLYIPL SILQVPYALV 
IAIASGVLEI LPIIGPWSAA GIAMTVALFQ PVTPFGLSNV SLVILLGVIY FVLRQIEDHF 
IIPNVMGPLV RLHPGVVIFA ILAGGALAGA FGLFISIPIA AVIRIILSYL YRKLTDQPEP 
PASADLPNPP PQGEPAVGEA ALSSQG