Gene Clim_2175 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_2175
Symbol
ID	6355969
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	2412896
End bp	2414092
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	52%
IMG OID	642669766
Product	aminotransferase class V
Protein accession	YP_001944178
Protein GI	189347649
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID	[TIGR03402] cysteine desulfurase NifS

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.670004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTT ATTTTGATAA TAATGCAACC ACTCCTCTGC ATCCCGAAGT TAAAAAGGAG 
TTGATCGAAG CGATGGGGAT GTTCGGTAAC CCTTCGAGTA TGCATGCCTG GGGCCGCGAG 
GCTCGGGCCA ATGTCGAGGA TGCCCGGAGT CGGGTGGCCG GTTTTATTGG AGCGCATGAC 
GATGAGATTG TTTTTGTCGG CAGTGGTTCC GAAGCCAATA ATACCGTGCT CTCTCTTTTT 
GTCTGCGCCT CAAACCAGTG TATTCCCGGT ACCAGGATGC GCAGTTCCAT TATTACGACG 
AAAATTGAAC ACCCCTGTGT GCTTGAAACC TCGGAATGTC TCGCTCACCG GGGGGCAAGG 
GTAAAGTATC TCAATGTTGA CCGTTACGGA AAAGTCGATC TCGATCAGCT TGCCGGTATG 
CTTGGAGATG ATGTCGGTCT TGTTTCGGTT ATGATGGCGA ATAATGAGAT CGGTACGCTG 
CAGGATATTG AAACCATATC GAAAATGGTG CATGAGTGCG GTGCGCTGAT GCACACGGAT 
GCTGTTCAGG CGGTCGGAAA GATTCCGGTT GACGTCGCCA TGCTCGGGGT GGATTTTCTT 
ACGCTTTCGG CTCATAAAAT ATATGGACCG AAAGGGGTTG GAGCTCTCTA TGTGAAAAAA 
GGCATTCCTT ACTGTCCGTT CATCCGCGGA GGTCATCAGG AGAGAGGTCG TCGGGCGGGA 
ACTGAAAATA CGCTTGGCAT TCTTGGTCTC GGAAAGGCCG TCGAAATGCG ACAGCTCGAA 
ATGGAGTCTG AAGAAAAGCG ACTGGCCGGG ATGAAAGCGG TTCTTAAAAA AGGCATTGAA 
GAGCGGATCG ACGATATTTA TTTCAACGGG CACCCGACCG ACTCCCTTTC GGGAACCCTG 
AACGTTTCGT TTCCCGGAGC TGAGGGAGAG GCGATTCTGC TCTATCTCGA TCTTGAAGGC 
ATTGCGGTTT CAACCGGGTC GGCCTGCGCC TCAGGATCTC TCGACCCGTC TCATGTACTG 
CTGGCAACGG GAGTCGATGC AGAGCGAGCG CACGGATCCA TCCGTATCAG CCTCGGGCGG 
GAAAGCACCA TGCAGGAGGT CGAGTACATG CTCGATATAC TGCCTAAAAC AATTAAACGG 
ATAAGAGACA TGTCAACGGC ATACATTAAA GGAGGAACAC ATGCTGCAAG CAGGTGA

Protein sequence

MKVYFDNNAT TPLHPEVKKE LIEAMGMFGN PSSMHAWGRE ARANVEDARS RVAGFIGAHD 
DEIVFVGSGS EANNTVLSLF VCASNQCIPG TRMRSSIITT KIEHPCVLET SECLAHRGAR 
VKYLNVDRYG KVDLDQLAGM LGDDVGLVSV MMANNEIGTL QDIETISKMV HECGALMHTD 
AVQAVGKIPV DVAMLGVDFL TLSAHKIYGP KGVGALYVKK GIPYCPFIRG GHQERGRRAG 
TENTLGILGL GKAVEMRQLE MESEEKRLAG MKAVLKKGIE ERIDDIYFNG HPTDSLSGTL 
NVSFPGAEGE AILLYLDLEG IAVSTGSACA SGSLDPSHVL LATGVDAERA HGSIRISLGR 
ESTMQEVEYM LDILPKTIKR IRDMSTAYIK GGTHAASR