Gene Sden_3686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sden_3686
Symbol
ID	4020243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella denitrificans OS217
Kingdom	Bacteria
Replicon accession	NC_007954
Strand	-
Start bp	4419337
End bp	4421100
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	47%
IMG OID	637957745
Product	triple helix repeat-containing collagen
Protein accession	YP_564682
Protein GI	91795031
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAATA AAATAGCACT CGCTATGGGA TTAATAGTTG TGGGTATAAG CCCACCTCTA 
TTTGCTGATA GCATGAAAAC TAGCTATTCG TTTAATCAAG CTAACGGTTA TCCGGGTAAT 
GGTGAGCAAA ATAGCAATGG TAATAAAGGT TACTTCCCAT TATCGGGTAA TGGTCAGTTT 
ATTACAGCAG GCCGTTCAGG GCTAGCGTTA GCCCAGGATG TGATGGTTGT TGGCGGATTA 
GCCCCCTTTA ATAAAGATAC ACCGTTAACG GTTTCTTTAT GGATAAAGCC TACTCAAGAT 
GCCGCTGGTG GCACCATTTT ATCCAGAAAA CACAGCGAAA ATGGCCAAGG CTTTAGCGTC 
GCATTTGATT TTGATATGAA TCTGGAATTC ACACTCGTCG ATGAATTTGG CGGCTCAATT 
TCAGTGGCCA CCTTAACCCC AGTGAATGTC GATCAAATGT GGCATCATGT TGCCGTTTCT 
TATAAGGGTG ATGCGAATGC ATCGAATATG GCCCTATATA TCGATGGTCA AGTGACTGAA 
TTAAAGCTGT CTTCAAATAG TTTGACCGGC CAAGTTGAGA CCTACCATCC CTTAGTCATA 
GGTGGCAGCT CGTCATATAC CCAAGCACTC GCTGCAGAAA TCGATGAAGT GTATTTAGTG 
CCTCAGAACT TTAATGCTGA GCAAGTGACG TGTCTTTATC AATTGAAAAC GGATTGTGCT 
TACAGGCCAA CCACAGGCAA AGAGGGCCCT CGAGGCCCCA TAGGTGAGCT TGGGGAGCAG 
GGTGATAGAG GTGCAACCGG AGTGAGCGGC CTAGCGGGCG ATGTGGGCCT CAAGGGTAAC 
GCGGGTTTAC CAGGGCCAGT AGGCCCACAA GGTCCTAAAG GGCCTCAAGG TTTCACGGGA 
CCTACTGGTT TAGCCGGAAT AGATGGCTCA GATGGTATTG ATGGCTCCGA TGGCACCAAT 
GGTGCACCTG GTGCTCAAGG TGCTGTGGGT GATAGCGGCA TTCAAGGGCC ACAAGGTTCA 
AAGGGATTGC AAGGAAACGT TGGGCCTAAA GGAGCTAGCG GAGATCGTGG TGCGCAAGGT 
GCCATGGGTA ACCAAGGCGT TGCGGGCATC AAAGGCTCTC AAGGTGCGCA AGGACCCACA 
GGTTATACCG GTGGTGCGGG TGTACAAGGC CCCGCTGGCT ATAATGGCCC ACAAGGTCCT 
CAAGGAAACC CAGGTTTGAC TGGTTACCCG GGGACGCCAG GTAGTGACGG GCCACAGGGT 
GCCACTGGGC CTAAAGGTAC TGACATTAAG GGTTATGCGG GGACTCCTGG TGCCATTGGC 
CCTCAGGGCC CAAGAGGAAG ACAGTTTTCA GTAGCTGAAT GTCGCATGGG GGCTTTTTCT 
TTTGATAATA AGACATTATC ACAATCTAAG GATTTCACGG CATTTACATC AGGTATTAAT 
CTTGCCTTAA AAGGTGAACC CAATATTGGA CCTGCTCCAG GGAAACCTGA ATTAGATGGT 
GTCATAGATA CTGAATATAT TCTATCTCGT GCCATGCGGG CTAATAAGGC TGGGATTATA 
TATATTAATT TTCATGTATT AGCGATTGAA ACTAAAGAAG AAGAAGAAGC TTTCTTTTCG 
GCGTTAGATA CAAGCGACAA AGCTGTGCAT GATTTTATTG TGGATTTATA CAGCCAAAAA 
GAACTCGACA ACAGATATGC AGCTGAAATA GACAACATAA TGGCGGCGCC CACTCCACTT 
CGATTTGAAG GAAGGACTCA GTAA

Protein sequence

MKNKIALAMG LIVVGISPPL FADSMKTSYS FNQANGYPGN GEQNSNGNKG YFPLSGNGQF 
ITAGRSGLAL AQDVMVVGGL APFNKDTPLT VSLWIKPTQD AAGGTILSRK HSENGQGFSV 
AFDFDMNLEF TLVDEFGGSI SVATLTPVNV DQMWHHVAVS YKGDANASNM ALYIDGQVTE 
LKLSSNSLTG QVETYHPLVI GGSSSYTQAL AAEIDEVYLV PQNFNAEQVT CLYQLKTDCA 
YRPTTGKEGP RGPIGELGEQ GDRGATGVSG LAGDVGLKGN AGLPGPVGPQ GPKGPQGFTG 
PTGLAGIDGS DGIDGSDGTN GAPGAQGAVG DSGIQGPQGS KGLQGNVGPK GASGDRGAQG 
AMGNQGVAGI KGSQGAQGPT GYTGGAGVQG PAGYNGPQGP QGNPGLTGYP GTPGSDGPQG 
ATGPKGTDIK GYAGTPGAIG PQGPRGRQFS VAECRMGAFS FDNKTLSQSK DFTAFTSGIN 
LALKGEPNIG PAPGKPELDG VIDTEYILSR AMRANKAGII YINFHVLAIE TKEEEEAFFS 
ALDTSDKAVH DFIVDLYSQK ELDNRYAAEI DNIMAAPTPL RFEGRTQ