Gene Cagg_0810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0810
Symbol
ID	7268834
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1010307
End bp	1011608
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	56%
IMG OID	643565660
Product	laminin G
Protein accession	YP_002462169
Protein GI	219847736
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.478954
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCAC ACAACGGCTA CAATCTCTAC CAGCATACCG CTTTACTTGC CCTGGTGGGT 
CTGTTAGTCA TGGCCCTTTT CTTCAGATCA ACACGTTACG CGGCGCCGCT CCAAGCCCAA 
GGGGGGTCAT CGCTGCGCTT CTATGGCAGC GACACCAATG ACCGCGACCG TGTAAAAATT 
CCACTCGGTC AGATAGACTC TGCGGGCCGG CTTATCACAT CTCACCCGGT GAACGTTGGC 
GATGCCTTCA CGCTTGAGTT TTGGATGAAG ACTGCGCTCG GCAATACCGC TCCGCCTTGC 
CCTACCGGTT GGTACACCGG CAACATTATC ATCGACCGTG ATGTGTTTGG GGCCGGCGAT 
TACGGTGATT ACGGCGTTGC TATCTGTAAT CAACGGTTGG TCGTAGGCAT AAGTGTGGGA 
AGTGATGACC GACTGCTGAT TGGTAATACG GTCGTCACCG ATGGCCTCTG GCATCATATT 
GCTATTGTCC GTGCCAACGA CGGTAAGGTA CGGCTGTTCG TCGATGGGCA ACTCGATGGC 
ACGCTGAATG GGCCGGTAGG CCGCATCGAC TACCGACAAA ATCGTTCGAC GAGTTATCCC 
ACGAGCGACC CTTATCTCGT ATTAGGAGCT GAAAAACACG ATTTCCCCGG TAGTCGATAC 
TACGATGGAT GGATTGACGA TATGCGTATA TCGCGCATTG CGCGCTATAC ATCTCCGTTT 
ATTCACCCCA CCGTACCGCA TGCGGTAGAC GATGATACCG TCGCACTTTA TCGTTTCGAT 
GAAGGAAGTG GGGTTGTTAT TGGCGATAGC GCTACCGGCG GCCTGAGTGT TGGTGAACTG 
AAACCGCGTA CCGGTGGAGC GGCACAACAC TGGTCGAACG ATACTCCATT CACGACGGTG 
GTTATAACTA CTGCGACCCA CACCGCCACG CCGGTTCCGT CGCCGACCCC GACCCACACC 
GCCACGCCGG TTCCGTCGCC GACCCCGACC CACACCGCCA CGCCGGTCCC GTCGCCGACC 
CCGACCCACA CCGCCACGCC GGTTCCGTCG CCGACCCCGA CCCACACCGC CACGCCGGTT 
CCGTCGCCAA CCCCGACCGG TACAGCCAAA CCTATGTCGA GTCCTACTAT CGTCAGTGTG 
CCACCAACCA CAACACCAAC ATTACCAATT CGGATTTACA TCCCTTTGAT TCTTCAGCCT 
CGTCTCGCCC CAAGCACATT ACAATCAGGA GTTGCACCGT ATGACCAGCC CAACCATCAA 
TCGAACCGAT CTCATCAATC TTGTTATTAC CAGCCTACGT GA

Protein sequence

MPSHNGYNLY QHTALLALVG LLVMALFFRS TRYAAPLQAQ GGSSLRFYGS DTNDRDRVKI 
PLGQIDSAGR LITSHPVNVG DAFTLEFWMK TALGNTAPPC PTGWYTGNII IDRDVFGAGD 
YGDYGVAICN QRLVVGISVG SDDRLLIGNT VVTDGLWHHI AIVRANDGKV RLFVDGQLDG 
TLNGPVGRID YRQNRSTSYP TSDPYLVLGA EKHDFPGSRY YDGWIDDMRI SRIARYTSPF 
IHPTVPHAVD DDTVALYRFD EGSGVVIGDS ATGGLSVGEL KPRTGGAAQH WSNDTPFTTV 
VITTATHTAT PVPSPTPTHT ATPVPSPTPT HTATPVPSPT PTHTATPVPS PTPTHTATPV 
PSPTPTGTAK PMSSPTIVSV PPTTTPTLPI RIYIPLILQP RLAPSTLQSG VAPYDQPNHQ 
SNRSHQSCYY QPT