Gene Cagg_1333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1333
Symbol
ID	7268624
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1650768
End bp	1652285
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	55%
IMG OID	643566175
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_002462676
Protein GI	219848243
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00265785
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAACTGT TTGTCGACTC GCTGCGGCGC AACATGACCG CCGAAGACGT GGTGAACCTC 
GAAGCATGCA TGAACTGCAA GATGTGCGGG GAGGCGTGCG CGTGGTATCT CGTGACCGGC 
GATGAAAAGC TCCATCCAAC CCACAAGACC GGTTTTCTCC GCCAGATTTA CCAGCGCTAT 
CTGACGGTCG AAGGGCGGAT CGGTGGTGCG CTTGGTCTCG TGCCGACACC CACCGTTGCC 
GATCTGAAAG AGAATATGCA GTATTTCTGG GCATGTACAG CTTGTGGGCG CTGTACGTTG 
GCTTGTCCGT CCGGTATCAG CATTCGCCGC ATGGTGCGTC TAGCCCGTGC CGCCTACACC 
GATTCCGGTT TGAGCCAGAC AAATCCGACT ATTCGTTCGA TTATCGAGAA TACCGATCGC 
CATCGACACA GTTTTGGTTT AACCGCTGCA CAGGTCCTCG GACGAGTCGG CCTCTTCTTG 
CGCAGTGAAG GACTGGAAGT GCCGGTCAAT GTGTCCGGCG CCGAACTGCT CTTTGTTTGT 
CCGGCTGCCG GAAATACCAA AATCCCCGAT TACGGCATCA AACTCATTAA AATTCTTAAC 
GCCGCCGGTG TCAGTTATAC CATTTCACCT TATGTTATCG ATACCGGTAC TGAAATTGAT 
CATATTGCTG TTCATCACAA CCTGTCGAAG CAAATGTTGT TGGACTGGGA GGAGGAAGCC 
GATCGGTTAG GTGTGAAAGC GATCCTGCTG GTGGAATGTG GCTGCGATAC GCGCACTCTA 
TACGCCGAGG CAACCGAAAC GCTTGGTCGC CCCTTCCGCT ACCCGATTAT CAGTGTTGAT 
TCACTGATGC TTGATCTAAT CCGAGAAGGA CGGTTACCGG TTGAAAAGAC CCAGTTGAAG 
GTAACCCTGC ACGATCCATG CTACGCAACG CGCCTCTCTG GGTTGGGTGA TCTGTTCCGC 
GAGCTGCTGA ATCTGGTTAC CGATAATTTC ATCGAGATGA CGCCAAACCG CGAGCACAAC 
TACTGCTGCA ACGGTGGGGC CGGTGGCATG CGGTTGCCGG AAAACACGAA TCTACGGCGC 
AAGATCTCGG TGCTGAAGGC AAACCAAATT CGCGCTACCG GTGCAGATTA TGTCACCTCA 
CCGTGTGTGG TTTGTACGTT ATCGCTGGAA GACACCTGCC AGACGTACAA TCTCTCGCCC 
ACCGGCGAGC GGATGGCGCT GGTGCTGTTC GAGGTCGTGT ATGCCGCAAT GGAGCCGGCG 
CTGGCGAAGC GCGGCGAACT CGACCGGATG CGCGTCCCTG CGGAGCTGCG ACACCGCGAT 
CATGAGTTCT TTGTCGCACA TAGTATCGAG GGCCAGATTG CGACACTGAT GCAGCAACCC 
GATTTTCCGG CTTTGCTCGA GTGGCTGGAG AAAGACGATA TTGTGAAGCG ATTTAGCAAA 
GATCATCCGC AGGTCTACGA TCTCCTCCGA TCGTGGCGGG AGTTTGCGAT GTCGCTCGAT 
CCGGAGTGCT GTCGGTAG

Protein sequence

MQLFVDSLRR NMTAEDVVNL EACMNCKMCG EACAWYLVTG DEKLHPTHKT GFLRQIYQRY 
LTVEGRIGGA LGLVPTPTVA DLKENMQYFW ACTACGRCTL ACPSGISIRR MVRLARAAYT 
DSGLSQTNPT IRSIIENTDR HRHSFGLTAA QVLGRVGLFL RSEGLEVPVN VSGAELLFVC 
PAAGNTKIPD YGIKLIKILN AAGVSYTISP YVIDTGTEID HIAVHHNLSK QMLLDWEEEA 
DRLGVKAILL VECGCDTRTL YAEATETLGR PFRYPIISVD SLMLDLIREG RLPVEKTQLK 
VTLHDPCYAT RLSGLGDLFR ELLNLVTDNF IEMTPNREHN YCCNGGAGGM RLPENTNLRR 
KISVLKANQI RATGADYVTS PCVVCTLSLE DTCQTYNLSP TGERMALVLF EVVYAAMEPA 
LAKRGELDRM RVPAELRHRD HEFFVAHSIE GQIATLMQQP DFPALLEWLE KDDIVKRFSK 
DHPQVYDLLR SWREFAMSLD PECCR