Gene Cagg_2145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2145
Symbol
ID	7267653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2635714
End bp	2637075
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	56%
IMG OID	643566977
Product	SAF domain protein
Protein accession	YP_002463465
Protein GI	219849032
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4091] Predicted homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.342497
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000671283
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTCTCG TTGACACTGC TCTCGCCCGT GCTGAAACCG AAGGACGCCC GATCCGGGTA 
GGCATGATCG GTGCCGGTTT TATGGCGCGC GGTATTGCTC TCCAGATTAT TCGCTACACC 
CGTGGGATGC GTTTAGTGGC AATTGCTAAC CGTACTATTG AGCGCGCTAT CCAGGCCTAT 
ACCGAAGCCG ACGTGCCTGC CGAGGCGATT CGGCGGGTTA CCTCGGCAAC TGCGCTCTCC 
GAGGCACTGG CCGCCGGCGC ACCGGCGGTC ACCGATGACG CACTCCTGCT CTGCGCTGCT 
GAGGGTATCG ATGTCATTCT CGAAGTCACC GGTGCGGTGG AGTTTGGAGC GCACGTGGCA 
CTGGCTGCTA TGCAACACGG CAAACACGTC GTGACAATGA ATGCCGAACT CGATGGCACT 
CTCGGCGCGA TTCTACAAGT CTATGCCCGT CGTTACGGCG TTATCTTTAC GCTGTCCGAC 
GGTGATCAGC CCGGAGTCAC GATGAATCTC TATCGGTTTG TTCGTGGATT AGGGGTCAAA 
CCGGTGCTGT GCGGTAACAT CAAGGGCTTA CACGATCCGT ACCGTAACCC AACTACCCAA 
GCCAACTTTG CCCGGCAGTG GGGACAAAAT CCGTACATGG TGACGAGCTT TGCCGATGGC 
ACGAAGATTT CGTTTGAACA GGCGGTCGTT GCCAATGCCA CCGGTATGCG GGTGGCACGA 
CGCGGTATGT TCGGCCCGAC CGTTCCCTCA GGAACACCAC TCGCCGATGT CGTACATGAC 
CTTTACCCGC TAGAGGCACT GATCGAAGGG CCGGGGATTG TCGATTATGT CGTTGGGGCG 
ACACCGGGAC CGGGTGTGTT TGTGCTGGGT ACCCACGATC ATCCACGCAT GCAGCACTAT 
CTCAACTTGT ACAAGTTGGG GAAGGGTCCC CTTTACCTCT TCTATACGCC GTACCATCTT 
TGCCACTTTG AAGTGCCCAA TTCAATCGCG CGTGTGGCAC TGTTCGGCGA TCAGGTGTTA 
GCCGCTGCCG GCCGACCAAT GGTTGAGGTT ATTACATCAG CCAAGACCGA CCTACATGCC 
GGTCAGACTC TTGATGGGTT GGGCGGCTAC ATGACGTATG GCTTAGCCGA GAATGCCGAT 
GTTGTTTACG CAGAACGTTT GTTGCCGATC GGATTAGCCG AAGGGTGTAC CTTGCGACGT 
GATATTCCCA AAGATGGCAT CATCACTTAC GACGATGTGG AGTTACCGAC CGATCGGCTG 
AGTGATCGTT TGCGTGCCGA GCAAGATGCG TTGTTTTGGG GTAAACCGGC TACTGCCGGC 
GCATCCGAAG GACAATACCA ACGCATAGCG CACACAGAGT GA

Protein sequence

MILVDTALAR AETEGRPIRV GMIGAGFMAR GIALQIIRYT RGMRLVAIAN RTIERAIQAY 
TEADVPAEAI RRVTSATALS EALAAGAPAV TDDALLLCAA EGIDVILEVT GAVEFGAHVA 
LAAMQHGKHV VTMNAELDGT LGAILQVYAR RYGVIFTLSD GDQPGVTMNL YRFVRGLGVK 
PVLCGNIKGL HDPYRNPTTQ ANFARQWGQN PYMVTSFADG TKISFEQAVV ANATGMRVAR 
RGMFGPTVPS GTPLADVVHD LYPLEALIEG PGIVDYVVGA TPGPGVFVLG THDHPRMQHY 
LNLYKLGKGP LYLFYTPYHL CHFEVPNSIA RVALFGDQVL AAAGRPMVEV ITSAKTDLHA 
GQTLDGLGGY MTYGLAENAD VVYAERLLPI GLAEGCTLRR DIPKDGIITY DDVELPTDRL 
SDRLRAEQDA LFWGKPATAG ASEGQYQRIA HTE