Gene Cagg_2733 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2733
Symbol
ID	7269804
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3357421
End bp	3358470
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	61%
IMG OID	643567556
Product	NMT1/THI5 like domain protein
Protein accession	YP_002464034
Protein GI	219849601
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.546218
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGC GTTTCATGCT ATTCCTTACC CTGATCATCT TCATTATCAC CGCATGCAGC 
GCACCGGCTC CGGCGCCGAC GGCGGCCCCC ACAACCGCGC CGGCGGCCAA TCCACAGCCG 
GAGTTGCGCA CAGTGACGCT GGCGATGTCG TACATTCCGA ACATTCAGTT TGCGCCTTAC 
TATGTCGCGG CGGCGAAGGG CTACTACGCC GCCGAAGGGA TTGAGGTCAA TTTCGACTAC 
AACTTCGAGA ATGACGTGCT CCAGCGCGCA GCGACGTGGC CGGCCAGTGG TGTTGCTTTT 
GCGACGACCA GCGGTACTTC GGTATTGCTC GCTCGCCAGC AGGGGGTGCC GGTCAAGACA 
GTGATGACGC TCTACCAGCG CTTCCCAATC GCGTTTTTTG CCAAGGCGAA CGTGCCGCTG 
GCGAGCGTCA ACGACCTGCG CGGGCAGACC ATCGGTATCC CCGGACGCTT CGGCGAGAGT 
TTCTATGCGC TGTTGGCGGC GCTCTATGCC GGCGGTATGA CCGAGGCCGA TGTGACGGTA 
CAAGAGATCG GGTTTACGCA GGCGGCGGCG GTGATGGAGG ACAAGGTGCC GGTGGCGATT 
GGCTACGCGA TGAACGAGCC GGTGCAATTG CGCGAGCAAG GGGTGGAGGT GAATGTGTTG 
CTGGCCGCCG ACGTCTTTAA TCTCGCTGCT AACGGCATCG CCGTCAGTGA GGCGCTGATT 
GCGCAAGAGC CGGAACTGGT GCGGAAGTTT GTGCGGGCCA GTTTGCGCGG GTTGGCCGAT 
ACGCTGGCTA ATCCGGCTGA GGCGTTCGAT CTGAGTCTGC AATTCATCCC CGAAGCGCAG 
CTCGGCAATC TCGACTTGCA GCGGAAAGTG TTGGCAGAGA GCTTACCCTT CTGGCAGAAC 
GAGCTGACGG CGCAACATGG GTTGGGTTAC ACTGACGGCC AACTGTGGGC GCGCACCGAG 
CAGTTTATGC GCGAGGCAGG TTTGCTGGCC GGGCCGGTGG AGGTGGAGAA GGCCTATACC 
AATGAGTTTG TGCCGGGCGG TTCGTATTAA

Protein sequence

MKLRFMLFLT LIIFIITACS APAPAPTAAP TTAPAANPQP ELRTVTLAMS YIPNIQFAPY 
YVAAAKGYYA AEGIEVNFDY NFENDVLQRA ATWPASGVAF ATTSGTSVLL ARQQGVPVKT 
VMTLYQRFPI AFFAKANVPL ASVNDLRGQT IGIPGRFGES FYALLAALYA GGMTEADVTV 
QEIGFTQAAA VMEDKVPVAI GYAMNEPVQL REQGVEVNVL LAADVFNLAA NGIAVSEALI 
AQEPELVRKF VRASLRGLAD TLANPAEAFD LSLQFIPEAQ LGNLDLQRKV LAESLPFWQN 
ELTAQHGLGY TDGQLWARTE QFMREAGLLA GPVEVEKAYT NEFVPGGSY