Gene Cag_1947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1947
Symbol
ID	3746707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2477545
End bp	2479194
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	45%
IMG OID	637774482
Product	DsrK protein
Protein accession	YP_380238
Protein GI	78189900
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.364031
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAAAT ACGCACCTAA AGTATCGGAA CTCAATGAGG AGTTCGAGAA AAAGAAGCCG 
AATATTCTTA AAGAGAATTA TTCAGGTAAG GAGTGGTGGG ATTTACCGGT TGAGTTTCGT 
GATGGTAACT GGTCATTCCC TGCTAAGCCC GAAGTGCTTG AAGAGCTTCA TTTTCCTAAT 
CCACGTAAGT GGATGGCTAC CGATGCCGAT TGGCAGTTAC CTGCTGGATG GGAAAAGACT 
ATTAAGGAGG GATTGCGCGA TCGTTTAAAG CGCTTCCGCT CGTTTAAGCT TTTTATGGAT 
GCCTGCGTTC GTTGTGGTGC ATGTGCCGAT AAATGCCACT TTTTCCTTGG TACAGGCGAT 
CCTAAAAATA TGCCAGTTGT GCGTGCTGAG TTGCTTCGGT CGGTGTATCG CAACGACTTT 
CCGCTTGCTG AAAAAATATT TAAAGGTTTT GCTGGGTCGC GTAAGCTTAC GCCTGAGGTT 
ATTAAAGAGT GGCACATGTA CTTTAACCAA TGTACTGAGT GTCGCCGTTG TTCCGTTTTT 
TGCCCAATGG GTATTGATAC GGCAGAAATT ACCATTATGG GGCGTGAGTT GCTGAACCTT 
ATTGGGGTGA ACAACAATTG GATTTTGGCA CCTGTTGCTA ATTGTAATCG CACAGGTAAC 
CATCTTGGAA TTGAGCCTCA TACCTTTGTG CAAAACATTG AGTCGCTTGC CGATGATATT 
GAGGATTTAA CAGGGGTTAC CGTACATCCT ACCTTTAACC GAAAAGGTGC AGAAGTACTT 
TTTGTTACTC CTTCGGGTGA TGTATTTGGC GATCCGGGTG TTTATACCAT GATGGGCTAC 
CTTTTGCTGT TTGAGCATAT TGGTTTGGAT TACACCATCA GTACCTATGC TTCTGAAGGT 
GGAAACTTTG GCTTTTTCAC CAACAATGAG ATGATGAAAA AGCTCAACGC CAAAATGTAT 
CACGAAGCGA AGCGCCTTGG CGTTAAGTGG ATACTTGGCG GTGAGTGTGG GCATATGTGG 
CGCGTTGTGC ATCAATATAT GAACACCATG AATGGTCCTG CTGATTTTCT TGAAGTGCCG 
ATATCGCCCA TTACAAAAAC AAAGTTTGAA CAAGCGGCTG GCACAAAAAT GGTGCACATT 
GCTGAATTTA CGGCTGACCT GATTAAGCAT AACAAGCTGA AGCTTGATCC AAAACGTAAC 
GACCACTTGC GTACCACCTT CCACGATTCT TGTAACGTGG CGCGTGGTAT GGGAATGTTT 
GATGAGCCTC GCTATGTGCT TAACAGCGTT TGTAACACCT TCCATGAAAT GCCCGAAAAC 
ACCATTCGTG AACAAACCTT TTGCTGTGGT TCGGGTAGCG GTTTAAATCC TGAAGAGTTC 
ATGGATATGC GTATGCGAGG TGGTTTTCCT CGCGCAAATG CCGTGCGTCA TGTTAAAGAC 
AAGCACAAGG TAAATTCGTT AGTTACCATT TGCGCTATTG ACCGCGCTAG CTTACCATCG 
CTTATGCGCT ATTGGAACCC AGGTATTACC GTGTATGGTT TGCATGAGTT AGTAGGGAAT 
GCCCTTGTTA TGAAGGGTGA GAAAAAGAGA ACTGAGGATT TACGAGAAAA TCCAATGGCT 
GGTTTTGAAG ATGGAGATGA TGATGAGTAA

Protein sequence

MSKYAPKVSE LNEEFEKKKP NILKENYSGK EWWDLPVEFR DGNWSFPAKP EVLEELHFPN 
PRKWMATDAD WQLPAGWEKT IKEGLRDRLK RFRSFKLFMD ACVRCGACAD KCHFFLGTGD 
PKNMPVVRAE LLRSVYRNDF PLAEKIFKGF AGSRKLTPEV IKEWHMYFNQ CTECRRCSVF 
CPMGIDTAEI TIMGRELLNL IGVNNNWILA PVANCNRTGN HLGIEPHTFV QNIESLADDI 
EDLTGVTVHP TFNRKGAEVL FVTPSGDVFG DPGVYTMMGY LLLFEHIGLD YTISTYASEG 
GNFGFFTNNE MMKKLNAKMY HEAKRLGVKW ILGGECGHMW RVVHQYMNTM NGPADFLEVP 
ISPITKTKFE QAAGTKMVHI AEFTADLIKH NKLKLDPKRN DHLRTTFHDS CNVARGMGMF 
DEPRYVLNSV CNTFHEMPEN TIREQTFCCG SGSGLNPEEF MDMRMRGGFP RANAVRHVKD 
KHKVNSLVTI CAIDRASLPS LMRYWNPGIT VYGLHELVGN ALVMKGEKKR TEDLRENPMA 
GFEDGDDDE