Gene Cagg_3500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3500
Symbol
ID	7266428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	4265848
End bp	4266888
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	53%
IMG OID	643568308
Product	hypothetical protein
Protein accession	YP_002464775
Protein GI	219850342
COG category	[S] Function unknown
COG ID	[COG0392] Predicted integral membrane protein
TIGRFAM ID	[TIGR00374] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAC CATTTGTCAA CGCACACAAA GCCGTCCGTC AGAACTGGAT TCAGTATGTC 
GTTGCTATCT GCGGCTTAGG GATTGTCTTA GGGTTGGCCT TAAGCTCTAT CGACCTGCAC 
GAGCTGCATC AAGTACTGAC GACTGCTAAT CCATGGTGGC TGACAGCCGC CGTCATCTGT 
AAAGTCCTTA CACCGTTAGG CACGGCGACG CTGTATGCCG GCGTCCTTCG CATGCTCGGT 
CATCACATCC GCGCGATCAG TCTCTGGTTG ATTGCACAAA TGGCGATTGT GATCAACATG 
GCATTTCCGG CCGGTCCGAT GGCGATGAGT GCCTTTCTCC TCCACGTCTT TCGCCGCCGA 
GGTGTACCGG AGGGCATTAC CACTATCGCC GTCGTCATCG ATTCACTGAC GTATGAGACG 
ACGTTCTTTG GCTTAGTTGG TTTTGGACTG GCCTATCTTC TGATGCATCG CGATCTCAGC 
GTGAGTCAAA TTACCGAAGT TGGGATCATT GCGCTAATCA TCGTTATCAC CGGAATGTAT 
CTCTGGGGAT TACAGCGTGA TCGTGCCGAT TTCACCCGCA AAGCAATTGC TGTTCAACAA 
TGGCTGGCCC GCCTTTTGCG CCGGCAGTGG CGACCAAATC AGGTTGAACA GTTTCTTGAC 
GAATTGTACC GTGGAAAGGC ACTTGTCGCT CGTCAACCAA AAACATTTTC ACGGTTACTG 
GGAATTCAGA TTGCTGTTCT GTGCCTCGAT ATCCTGACGC TCTACTGTGC CTTTCGCACG 
GTTGGGAGTG ACCCGCACCT ATCGGTCGTG ATCCTGAGTT ATAGCCTCGC CAGTCTTTTT 
GCGACGCTGG CACCCCTGCC CGGCGGCGGT GGCTCGTTTG AAGCAACCCT TGTCTTGGTT 
GCATCACGTC TTGGCATTTC CCCCACTGTC TCGTTAAGCG CGACGCTCAT CTACCGGATT 
TTGACCTTCT GGCTACCCGG CTTGCTGACC ATTATTATGT ACCGTCTGCT CAAACCGACA 
TCATCGCAGA CCCATACGTG A

Protein sequence

MAEPFVNAHK AVRQNWIQYV VAICGLGIVL GLALSSIDLH ELHQVLTTAN PWWLTAAVIC 
KVLTPLGTAT LYAGVLRMLG HHIRAISLWL IAQMAIVINM AFPAGPMAMS AFLLHVFRRR 
GVPEGITTIA VVIDSLTYET TFFGLVGFGL AYLLMHRDLS VSQITEVGII ALIIVITGMY 
LWGLQRDRAD FTRKAIAVQQ WLARLLRRQW RPNQVEQFLD ELYRGKALVA RQPKTFSRLL 
GIQIAVLCLD ILTLYCAFRT VGSDPHLSVV ILSYSLASLF ATLAPLPGGG GSFEATLVLV 
ASRLGISPTV SLSATLIYRI LTFWLPGLLT IIMYRLLKPT SSQTHT