Gene Cagg_0704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0704
Symbol
ID	7266956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	871823
End bp	873091
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	54%
IMG OID	643565555
Product	protein of unknown function DUF1501
Protein accession	YP_002462064
Protein GI	219847631
COG category	[S] Function unknown
COG ID	[COG4102] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGTG AGCGGCACAG ATGGATAAAG TCGAACTTAC GTGGTGGTTG CGATGGACTT 
AGCCTGCTTA GCCCCTACGA TGATACCTAC TACCGTTCGG CAAGGGGAAC GTTGGCCTTG 
CCATTAAGCG GCCCCAATGC ACCGTTGCGG ATCGATACTA ACAATCCCTC ATACAACACG 
AACAGCTTCG GCTTCAATAG CAAGATGCCG CATCTGCGCG ATCTTTACAA CAGCGGCCAT 
CTGGCTCTCA TCCATGCCTG CGGGTTAGAT GACGACACCC GCAGCCATTT TGATGCGATG 
GACTACATCG AGCGCGGGAC ACCGGGCAAT AAAACCACAA ACAGCGGATG GCTCACCCGT 
CACTTGCAGT CGCAGGGAGG AACCAGCAGT TTACTACCGG CAGTCGCAGC AAATACCGCC 
GTGCCAGCCT CGCTGCTCAA TCACCCGCCG GCAATTGCAC TGTCGTCGCC GAGCAGTTTC 
ACGGTGAGCA CGCATTGGCG CTACAATCGC GAACAAGATA ATTTTCCGTT CCTGACTACG 
CTGCGCGAAA TGTACAACCG CAGTACGATC TATCCATTGG CGTCGGCCGG TCGGCGAGTG 
ACGCAGGTGC TTGATCTGAT GCGTACTATG GGGAGCTATA CCCCAGCTTC GAGTATCGCT 
TATCCTTCTG GTACATTTGG CGATGCGTTG AAGACGGTGG CTCAGTTGAT CAAAGCTGAG 
ATTGGCCTGC AAATAGCGAC GATTGATTTC GGTGGCTGGG ATACCCACGA AGCACAGGCA 
AACAGCGATG GTGGTGGCTA CTTACCCGAT CGACTCGGTG TGCTTTCGCA GGGATTGGGC 
GCGTTTTACA ATGACCTCGC AGCATATCAC AACCGCTTGA CCATCGTTGT TCTGAGCGAA 
TTTGGTCGTC GGTTGGGACG TAACCGGTCG AACGGTACCG ATCACGGCCA TGGTAATATG 
ATGATGGTAC TGGGCGGCAA TGTGAACGGA CGCAAAGTGT ATGGTACGTG GCCGGGGTTA 
CATCCCGATC AGCTTGATAA ACGGCAAGAT TTGCAGATTA CAACTGACTT CCGACAGGTG 
CTGAGTGAGA TTTTGATTCG CCGATTGGGT AACCCGCTGC TTGGAGTGAT CTTCCCGGGC 
TTGACATCGT ACACACCGCT AGGAATTGTG CGCGGGACCG ATTTACCACC GGTACTCTCT 
GCTGACACGG TAGCACCTGC CAATACGGAG CATCGTATTT TCGTACCGGT GATTCAGCAA 
TGTCGGTAG

Protein sequence

MLRERHRWIK SNLRGGCDGL SLLSPYDDTY YRSARGTLAL PLSGPNAPLR IDTNNPSYNT 
NSFGFNSKMP HLRDLYNSGH LALIHACGLD DDTRSHFDAM DYIERGTPGN KTTNSGWLTR 
HLQSQGGTSS LLPAVAANTA VPASLLNHPP AIALSSPSSF TVSTHWRYNR EQDNFPFLTT 
LREMYNRSTI YPLASAGRRV TQVLDLMRTM GSYTPASSIA YPSGTFGDAL KTVAQLIKAE 
IGLQIATIDF GGWDTHEAQA NSDGGGYLPD RLGVLSQGLG AFYNDLAAYH NRLTIVVLSE 
FGRRLGRNRS NGTDHGHGNM MMVLGGNVNG RKVYGTWPGL HPDQLDKRQD LQITTDFRQV 
LSEILIRRLG NPLLGVIFPG LTSYTPLGIV RGTDLPPVLS ADTVAPANTE HRIFVPVIQQ 
CR