Gene Cagg_1992 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1992
Symbol
ID	7268908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2433943
End bp	2435538
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	45%
IMG OID	643566823
Product	hypothetical protein
Protein accession	YP_002463316
Protein GI	219848883
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00260165
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCACACCT CTCAATCAAT GCGAGGCAAA AAGCTCTTTA TTGACGCAGC AATTATTTGC 
TTCTTAATAA TGGCTTGGTT CAAATTATGC ATGGGAATAG AATCAAGTTT GGAAGTAGAC 
ACTGCTGCCG ATGAGACACT CTACCTCTAT TCAGGAATCA CGCAAACCAC CCCCGCCGAC 
TACGGCCCGC TGTATGGCCT ATGGTATTGG CTGCTCTGGT GGACTACGCC CGATCGCATC 
GACCTCTACT ATTTGAACTG GCGCATGACC ACTCTCTTAC CGGTTCTCGC ATTTTACTTG 
ATCTGCCGAC TTAATCGAGT TACACCACTG GTTAGTGCTG TCGCAGCATG GTTATTACTC 
ATCTCGTCGA TCAACGTATC GACATGGCCG CGAGTATCAC ACCTTGCGCT CTTCATAGTG 
TTGCTAAGTC TCTCCGCGAT TAGTCTGTTA CGATCACGGA GTCGGAGCAG CTTGGCTATC 
GCTACCGGCT TGCTGGCAGC TAGCTATGTT CGACCGGAAT TGTTTCTTTC CTACGTTGCT 
GGATTAGGTG TCGTTCTGAT TGATCTCATC CGTGATTATC GCCAAAAACA GCTATTGCCA 
TGGCTAACAA TGATCATAAC TGGCTTCGTG CAACTAGCAC TCCTGATTTG GCAAGGGGTT 
CCAATGACAG GCGAGCGTAG TTTCGTTGCA TTCTCTCAAC ACTTTGCAAC AAGCTGGATA 
ACATGGAACA ACAGTCAGCT CGATCCTTGG AACGATTTCC CATATATTAT GCAGACTGCT 
TTTGGCGACG ACGTAGATAC CGTTTGGGAA GCTTTTTTGG CCAACCCGAT GTTAATTCTA 
CGTCATATGG TACAGAATGT CATCCGATTG TACGGTATTG CAACGCTATT ACCTGTAGGT 
GTCGTTCACT ACTCCGCCAC CGCTGATCGA ATAGACAAAC TCTTCTTGTG GGTAGTTCTC 
TTCACAGCAC TGGGAGTATT TCTGATGACC CTTCATCTCA TTCGTCGCTC AATTAGCGAA 
CTACTTTTTC GCAAAGAGCA CAACCGCTTG CGAGTATGGA TAATTATTTG TACATTACTA 
GTCTTTATAT CGATAATATC CATCTATCCA AGGCCTCACT ATTTACTTTT ACTTATACTT 
CCTCTGCTTT TCTTTGTTAT AGTTGTGTAT ACCGCTAATC AACCACTAAC ACCACCGAGA 
CTACCTGAAT TAGTATTAAC AGTTTCATTA ATGTTCTTGC TAACTCCAAT GCCATGGTGG 
AGTACCAACA ATCAATGGCA AACGCCGGCA CTACGCTTCT TGAATACGCT AAACTCTGTG 
CAACAGGCTC AATTAACAGT TTTAGTACCA CTTGACATCG CTGGACTTTA TATCCCAACG 
TTCAAAAAGA TAATAGCATA CCATGAAAAC GGTAATGAAT TCATGGATCT CCTTGACGAA 
GCCGACATCG TTATTATCGG TAGTGTATCT TCCAGCGAGA CGATCCGGCG CTTTACCAGT 
TATCCGCAAC AGTACGGCTT CGAACCTATA CTTGAACCGT ACATCCCAAG TTTATTTATA 
CGATCAGAGC ATCGTCAACT ATTCTCAACG AAATGA

Protein sequence

MHTSQSMRGK KLFIDAAIIC FLIMAWFKLC MGIESSLEVD TAADETLYLY SGITQTTPAD 
YGPLYGLWYW LLWWTTPDRI DLYYLNWRMT TLLPVLAFYL ICRLNRVTPL VSAVAAWLLL 
ISSINVSTWP RVSHLALFIV LLSLSAISLL RSRSRSSLAI ATGLLAASYV RPELFLSYVA 
GLGVVLIDLI RDYRQKQLLP WLTMIITGFV QLALLIWQGV PMTGERSFVA FSQHFATSWI 
TWNNSQLDPW NDFPYIMQTA FGDDVDTVWE AFLANPMLIL RHMVQNVIRL YGIATLLPVG 
VVHYSATADR IDKLFLWVVL FTALGVFLMT LHLIRRSISE LLFRKEHNRL RVWIIICTLL 
VFISIISIYP RPHYLLLLIL PLLFFVIVVY TANQPLTPPR LPELVLTVSL MFLLTPMPWW 
STNNQWQTPA LRFLNTLNSV QQAQLTVLVP LDIAGLYIPT FKKIIAYHEN GNEFMDLLDE 
ADIVIIGSVS SSETIRRFTS YPQQYGFEPI LEPYIPSLFI RSEHRQLFST K