Gene Cagg_3075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3075
Symbol
ID	7269492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3737980
End bp	3738960
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	58%
IMG OID	643567895
Product	Helix-turn-helix type 11 domain protein
Protein accession	YP_002464369
Protein GI	219849936
COG category	[K] Transcription
COG ID	[COG2378] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00643592
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000271212
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGTCGATA TTAGCTACCG TTTGCGCAGC AAAGCCGCAC GGTTGCGGAA CCTTGAACAC 
AAACTCTACA ACGCGCCACC GCAAGGCTGG AGCGTGATCG AGCTAGCCAA ACAATGCGGT 
GTCAATCGCC GCACCATCTA CCGCGACCTT GAGGCGCTCA GCGCAGCGGG AGTACCGATC 
TGGGAGCACA ACGGTAAGTA CGGCATTGAC CGCAACACCT ATCTCGCCAC CGTTCGGCTC 
AACCTTCACG AAGCAGTCGC GCTCTTTTTT GCGGCACGAC TGCTTAGTCA CCACAGCGAC 
GAACACAACC CACATATTGT TACGGCGCTG GATCAACTCG CTGCCGGTCT ACCCGATCAA 
ACCATTGCCG GTCATATGGC GCGGCTGGCA AGCATTGTTC GGGAGCGACC ACCCAATCCA 
CACTACGTTC ACACCCTCGA ACTGCTCACC CGCGCATGGG CCGACCGGCA GATGGTGCGT 
ATCCGTTACC GTGCCCCCAA CCGACCGCTC ACCGAACGCG ACATTGCCCC CTATTTTCTC 
GAAGTAGTAC GGACAACGCC GGGAGTTTAC GTGATCGCGT ATGATCGGCT ACGCAACGAT 
CTGCGCACCT TCAAACTTGA ACGGATCGAG CACGCCCAAC TCCTTGACGA ACGGTTCGAC 
ATTCCGGCAG CATTCGACCC GTATGAGCGA TTGGCACAGG CGTGGGAAGT CATGCACGAG 
ACGGCAGTTG CCATCCACTT ACGCTTTAGC CCGGCTGTTG CCCCGCGTAT CCGTGAGACA 
CGCTGGCATC ATAGTCAGCG CCTGATTGAC AATGCCGATG GTAGCTGTGA CTTGCACCTC 
ACCGTTGCCG GCATCCGCGA AATCCTGGGC TGGGTGTTAA GCTGGGGGCC TGATGTGCAA 
GTGTTGGCTC CACCCGAGTT GCGAGACACC GTGATCGACT ACGCCCGCCG TCTCTTAGCA 
CGGTACCAGC AGGATTGGTA G

Protein sequence

MVDISYRLRS KAARLRNLEH KLYNAPPQGW SVIELAKQCG VNRRTIYRDL EALSAAGVPI 
WEHNGKYGID RNTYLATVRL NLHEAVALFF AARLLSHHSD EHNPHIVTAL DQLAAGLPDQ 
TIAGHMARLA SIVRERPPNP HYVHTLELLT RAWADRQMVR IRYRAPNRPL TERDIAPYFL 
EVVRTTPGVY VIAYDRLRND LRTFKLERIE HAQLLDERFD IPAAFDPYER LAQAWEVMHE 
TAVAIHLRFS PAVAPRIRET RWHHSQRLID NADGSCDLHL TVAGIREILG WVLSWGPDVQ 
VLAPPELRDT VIDYARRLLA RYQQDW