Gene Cagg_3171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3171
Symbol
ID	7269920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3849279
End bp	3850319
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	53%
IMG OID	643567992
Product	hypothetical protein
Protein accession	YP_002464465
Protein GI	219850032
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.208878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAAACT GGAAATTATG GCTCGGATTC ATCATTAGTA TCATATTCCT CGGTATCGCC 
CTCTACGGTC TCGATCTCGT CCATTTCTGG GAAGCACTGC GCGAGGCGAA TTACTGGTGG 
CTGATACCGG GCATTGTCGT TTATTTTGCC ACGGTCTGGG TGCGCACGTG GCGCTGGCAA 
TCGATGCTCA ATCACATTGC CTTTGTGCCG TTACGATCCC TCTTCCCAAT TGTGGTTATC 
GGTTACATGG GGAATAACGT CTACCCTGCA CGCGCCGGCG AAGTGCTGCG GAGCTATGTG 
CTGCGTCGCA ACTGCGGTAT CGCGATGAGT GCCTCGTTGG CGACCGTCGT GCTTGAACGA 
TTGTTTGACG GTCTGGTGAT GCTCTTGTTC GTCGCAATTA CCCTTCCCTT CGCTCCTTTG 
CCGAACACAT TCCGCACCCT CGTGATCGGG TTTAGTGCGA TGTTTATCGC AGCATTAATC 
GGCTTCATTG CCGTCGCTGC TTATCCGCAA CGCATGAGTC GGCTCTACAC CTTAGCCGTT 
GATCGTTTTG CCCCGCCGTT TTTACGCCCA CGTATTCACG GCCTCTTTGA CCGGTTTATC 
ATCGGCTTAC AATCGCTGCG TAGCCCACGG GAGGTGCTGG TTATTCTGAT CACCTCTACG 
TTGATCTGGT TAGGTGAAAC GTTAAAATAC TGGTTTGTGA TGCATGCTTT TCCGTTTGAA 
GTGTCGTTCC TCGTCTTGAT GCTCATGACG GCGGTGGTGA ATCTCTTTAC CACCATCCCC 
TCCACACCGG GATATATCGG TACGTTTGAT GCACCCGGCA TTGCGATTTT GACCCAATTC 
GGTGTTGCCC ATGCAATCGC TGCCGGCTAT ACGCTGGTAT TACACGTTGC GTTATGGTTG 
CCGGTTACCC TGCTCGGTGC GTGGTATATG CTGCGCCAAA GCCTGACGTG GCGCGATATG 
GATCGGGCGG CAGCGTTGCG ATCCCAAACA AGCCCCGCGG CCAACGATGA AGTTATCACG 
ACACAAAAGG TACTGCCATG A

Protein sequence

MRNWKLWLGF IISIIFLGIA LYGLDLVHFW EALREANYWW LIPGIVVYFA TVWVRTWRWQ 
SMLNHIAFVP LRSLFPIVVI GYMGNNVYPA RAGEVLRSYV LRRNCGIAMS ASLATVVLER 
LFDGLVMLLF VAITLPFAPL PNTFRTLVIG FSAMFIAALI GFIAVAAYPQ RMSRLYTLAV 
DRFAPPFLRP RIHGLFDRFI IGLQSLRSPR EVLVILITST LIWLGETLKY WFVMHAFPFE 
VSFLVLMLMT AVVNLFTTIP STPGYIGTFD APGIAILTQF GVAHAIAAGY TLVLHVALWL 
PVTLLGAWYM LRQSLTWRDM DRAAALRSQT SPAANDEVIT TQKVLP