Gene Sden_3685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sden_3685
Symbol
ID	4020242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella denitrificans OS217
Kingdom	Bacteria
Replicon accession	NC_007954
Strand	-
Start bp	4417856
End bp	4419337
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	53%
IMG OID	637957744
Product	triple helix repeat-containing collagen
Protein accession	YP_564681
Protein GI	91795030
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGGA TTTTTCACTC GTTAACCACA GTCGCCCTCT TGGGCTTAAG TTCAGCATCG 
GCCGTGGCAT CAAACTGGGA TGCCCATTGG TCCTTTGCCG GCCATGGTAA TGACAACTTT 
AATGGTGCCC ATCATGGTGC CTTCCCGTTA AGCGGCACTG GCAGTTTCGA ATTCGGCAAG 
CTTAATCAGG CCCTTTATTA TGACATTCTT AAAGTGGACT CCTTGAGCAT TCAAAAAGCG 
GCTGAGCCTT TCTCTTTGTC CTTCTGGGCC TTGAGAGAAA CCCGTGATTA TGCCGAGACC 
TTATTCTCTA AACAGCAGTC GCCATTCAGC GCCGGTATGT CGGTCAGCCT CGATGGTGCC 
AATGCCATAG TGGTGGATAT TCGTAATGGT CAAGGCGGCA GTATCAAGAT AAAGAGTCAG 
CAAGTCTGGA CCGATATGAA TGATTGGCAT CATTTAGTCG TGACCTACAA TGGCTCAATT 
CAGGCAGGTG GCATTAGTTT GTACCTTGAT AATCAACGGC TCGATGTCGA TGTTATCAGT 
GACAACTTAA CCGGAGACAT AGGGGCAAGT GACCCTGTCG TTATCGGTGC TGACAGCGAA 
ACTAGCTACG CCACCTTCAA CGGTGCCATC GATGAAGTCT ATTTAGGCAG CCGCGCCTTT 
AATAGCAGTG ATATCGAGTG TCTGTATGCA CTGAGAGACA ACTGTGTCGA TCCCATTAGT 
GACGAGCCTC CAGTGATTGC CCCTCAAGGG CCACGGGGCT TTGAAGGCCC CGCTGGGCCA 
CAGGGTCTAC GGGGGGCAAC AGGCTCGCAA GGTGTTAAGG GAGCGAAAGG CCCAATTGGC 
GACCCAGGCG TCAAAGGCCC GCAAGGCTCG CAAGGCAGCA AAGGCGATCT GGGCTTGAAG 
GGCCTAACAG GCATCGCGGG TAATCCAGGT GTTGATGGCC GTAATGGCCG TGATGGTAAA 
GATGGCAACG CGGGCTTAAT GGGCTTACAA GGCCCAGATG GCCTGCAAGG CCCTAAAGGA 
GTCCGGGGGG ATACTGGCCC GATGGGACCA CAGGGCGATC CTGGACCTCA AGGCTTAAAA 
GGGGCGACTG GCGCCAAGGG CGTCACTGGA GCGACTGGCG ATGCTGGCCC ACAGGGCTAT 
GCCGGTGCAC CTGGCATTCC TGGTGCTGAT GGTGTTCAAG GTAACCCAGG TTTACCAGGT 
TTGAAAGGGA ACACTGGATC TTCTGGGCCC TCAGGCGCTC CTGGCGGCAA AGGCCCCAAA 
GGGCTAAAAG GCCCTCATGG GGATGTTATT CCTGGTGATA ATGCCCCTGC ATTTGGTCCA 
CAGGGGCCAA GAGGCCCAGA TGGCTACAAT ACTTATTACA GCACTGGTGG ACGTAATTTT 
AGCATGGGAA CAGTACTCTC TACGGAAAAA GCCCTGAGTC CGGTTGAACG ATATAAGGCG 
ATACAGGCAA GTAAAGCTAT CCAGGATGGA GACATAAAAT GA

Protein sequence

MKRIFHSLTT VALLGLSSAS AVASNWDAHW SFAGHGNDNF NGAHHGAFPL SGTGSFEFGK 
LNQALYYDIL KVDSLSIQKA AEPFSLSFWA LRETRDYAET LFSKQQSPFS AGMSVSLDGA 
NAIVVDIRNG QGGSIKIKSQ QVWTDMNDWH HLVVTYNGSI QAGGISLYLD NQRLDVDVIS 
DNLTGDIGAS DPVVIGADSE TSYATFNGAI DEVYLGSRAF NSSDIECLYA LRDNCVDPIS 
DEPPVIAPQG PRGFEGPAGP QGLRGATGSQ GVKGAKGPIG DPGVKGPQGS QGSKGDLGLK 
GLTGIAGNPG VDGRNGRDGK DGNAGLMGLQ GPDGLQGPKG VRGDTGPMGP QGDPGPQGLK 
GATGAKGVTG ATGDAGPQGY AGAPGIPGAD GVQGNPGLPG LKGNTGSSGP SGAPGGKGPK 
GLKGPHGDVI PGDNAPAFGP QGPRGPDGYN TYYSTGGRNF SMGTVLSTEK ALSPVERYKA 
IQASKAIQDG DIK