Gene Cagg_2420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2420
Symbol
ID	7266143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2939092
End bp	2940183
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	643567246
Product	HEAT domain containing protein
Protein accession	YP_002463729
Protein GI	219849296
COG category	[C] Energy production and conversion
COG ID	[COG1413] FOG: HEAT repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGACC GCGAAACGTG GCGGCAGCGG ATCGCCGAAC GCTTTAACAA CTTCGCCCGC 
AACCCTCGGC AGGAGATCCA AGTTACCGGT GTGAACACTG TGCTTGGCTT TTTAGCCGTG 
CGTGCGCTTG AACCGTTCCT CGAAGCATTT CAGGACGAAC CGGTAGCAGC CGTGCTGACC 
CTCGCCGAGA TTTCCCGTGG TCCCGGCGCC AACCATCTTG TGCGTCGTGC TTTCCACTGG 
CGCTACCAAC TGGCACAACT GATCGAACGT GAGCTGCGTT CACGGCCTGA ATTGCGGATC 
ACCGTCGAAG AGATTCTGAT GGCCTTAAAC GTGATCCATC TGGCCCGCCA ACGGTTGAAT 
AGCTCACGTG ACGAGTGGCT ACGCCTAACC CTGCTCGCCG AACTTGACAC CTTTGAGCCC 
GGTGATTTCG AGCAGCTTCG TCGCCAGTTG CACGACCCCG GCTGGCAAAG TCGCTATGAA 
GCCATTCGCC GTCTGCGTGT GCGCGAAGGC AATTTTACCG CTGCCGATCT GGTCTTGCTC 
CACGATGGGC TGAGTGATAG TGCCTCACAC GTGCGTGCAG CAGCAGCGCG TACCCTTGGT 
CTCATCACCG GTACACCGCC CCAACCCCTC GTCAAGACGT TAATCCGGCT TGCGATCCAC 
GATTGCGATC TGGAAACCCG CTTCGCCGCC GCACGCACGC TCGGTCAACT GCGTGACCGT 
ATCGCTTCAC CGCAGTTGAT CGATTATCTG GTTGAATGCC TGGAAGATCC CGATAGCTTC 
GTTCGCTCGG CAGCAGCCTT GGTGGTGAGC CAGTTGGGCG AGATGGCCGG TACCGGCCCG 
GTGATCGACC ACCTCCTCGT TATGCTCAAC GATGTCGATG CCTACGCTCG TGAATCTGCC 
GCGCGCGCCC TCGGTCGTCT CGGTGTCGCT GCTGCGACCT CTACCGTCCT GAATGCGCTT 
GCCCAGGCCG TTGATGATGC TGACCCTAAT GTCCACGAGG CAGCAGTTGA TGCCATCGCT 
CGCCTGCGGA AGCTACGCGC TACCCTACCA CTCACGCAGA GCCGCCATCC CACGGAGCCG 
TTAGCAGTCT AG

Protein sequence

MFDRETWRQR IAERFNNFAR NPRQEIQVTG VNTVLGFLAV RALEPFLEAF QDEPVAAVLT 
LAEISRGPGA NHLVRRAFHW RYQLAQLIER ELRSRPELRI TVEEILMALN VIHLARQRLN 
SSRDEWLRLT LLAELDTFEP GDFEQLRRQL HDPGWQSRYE AIRRLRVREG NFTAADLVLL 
HDGLSDSASH VRAAAARTLG LITGTPPQPL VKTLIRLAIH DCDLETRFAA ARTLGQLRDR 
IASPQLIDYL VECLEDPDSF VRSAAALVVS QLGEMAGTGP VIDHLLVMLN DVDAYARESA 
ARALGRLGVA AATSTVLNAL AQAVDDADPN VHEAAVDAIA RLRKLRATLP LTQSRHPTEP 
LAV