Gene Cag_0940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0940
Symbol
ID	3747093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1275940
End bp	1276980
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	45%
IMG OID	637773470
Product	hypothetical protein
Protein accession	YP_379246
Protein GI	78188908
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2957] Peptidylarginine deiminase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTACCA CTTATCATAT GCCGCCCGAA TGGGCATTGC ATCAAGCAAC ATGGCTCTCT 
TGGCCTCATA AATTGGAATC GTGGCCCGGT AAATTTGAAC CTGTGCCTGC CGTATTTGCC 
GAAATTGCCG CATGGCTCAG TACCTCGGAA GAGGTACATA TTAACGTGCT TGATGAAGCA 
ATGGCAAACG AAGCTCGCCG CCTTATTAGC AAAGTACAAG GAGTCCCGCT TCGTATGGAA 
CGTATTGTGC TGCACACCAT TGCCAACAAC GATGCATGGT GCCGCGATTA TGGGCCAAAT 
TATGTGTTTC ATGAAAAAGA TGGCAAGCGT GATAAAGTTA TCATCAAATG GAAATACAAT 
GCTTGGGGTG GCAAGTACGA GCCATACGAT GCTGATGATA ACGTAGCATT TGTTATTGCC 
GCTATGCAGC AAATCCCACT TTTTGAAACA GCAATGGTGC TTGAAGGTGG TTCGATTGAT 
GTAAATGGTG AAGGGCTTTT GCTTACAACC GAAGCGTGCC TTCTTAATCC AAATCGCAAT 
CCATTTCTCA ATAAAGAGCA AATTGAGAAA ATATTAGGTT GTTATCTTGG AGTGCAAAAA 
GTGCTGTGGC TTGGCGATGG CATTGTGGGC GACGATACCG ATGGGCATAT TGACGATTTG 
GCACGTTTTG TAAATGCCAA CACGGTAGTT ATTACCGTTG AAGATGATCC TGCTGACGAA 
AACTATCCCA TTTTGCAGGA GAATTATGAG CGCCTCTGCA CCTTTACCGA TTTGGAGGGT 
AAGCCACTCA ATGTGGTTAA ACTGCCCATG CCATCAACCG TTTTTTATAA CAATGAACGG 
CTTCCTGCTA CTTATGCCAA TTTCTACATT GCCAACAGCG TTGTGTTAGT ACCAACCTAC 
CGTTGCGCTA ATGATGCCAA AGCTATTGAA ATTCTTCAAC GCTATTTTCC CACCCGACAA 
GTTATTGGCA TTGATTGCAC CGACCTTATT TGGGGGCTTG GCGCTATCCA TTGCATTTCC 
CACGAAGAAC CAGTGTTGTA A

Protein sequence

MPTTYHMPPE WALHQATWLS WPHKLESWPG KFEPVPAVFA EIAAWLSTSE EVHINVLDEA 
MANEARRLIS KVQGVPLRME RIVLHTIANN DAWCRDYGPN YVFHEKDGKR DKVIIKWKYN 
AWGGKYEPYD ADDNVAFVIA AMQQIPLFET AMVLEGGSID VNGEGLLLTT EACLLNPNRN 
PFLNKEQIEK ILGCYLGVQK VLWLGDGIVG DDTDGHIDDL ARFVNANTVV ITVEDDPADE 
NYPILQENYE RLCTFTDLEG KPLNVVKLPM PSTVFYNNER LPATYANFYI ANSVVLVPTY 
RCANDAKAIE ILQRYFPTRQ VIGIDCTDLI WGLGAIHCIS HEEPVL